
Tech • IA • Crypto
Anthropic introduit des magasins de mémoire persistants pour agents, permettant de conserver des données entre sessions. Cette couche agit comme un système de fichiers, accessible en lecture/écriture par les agents. Elle corrige la limite majeure des agents « sans état », incapables de gérer des tâches longues ou des suivis. Résultat : une continuité opérationnelle et des workflows multi-étapes enfin viables.
Anthropic ajoute un mécanisme asynchrone de “dreaming” pour consolider et affiner les connaissances. Les agents peuvent retraiter leurs expériences hors temps réel pour améliorer leurs performances futures. Cette approche rappelle des boucles d’apprentissage différé, appliquées aux agents. Elle ouvre la voie à des systèmes qui s’améliorent sans intervention humaine directe.
Les équipes d’Anthropic migrent vers des spécifications en HTML pour les workflows IA. Le format permet une structure plus riche, des visuels intégrés et une meilleure lisibilité pour humains et agents. Cette évolution améliore l’interprétation des exigences complexes. Elle réduit aussi les erreurs liées à des specs ambiguës ou trop linéaires.
Les evals s’imposent comme socle du développement d’agents fiables. Elles transforment des impressions subjectives en métriques mesurables et comparables dans le temps. Des benchmarks comme SWE-bench ou ARC-AGI restent utiles mais insuffisants pour des cas réels. Les équipes construisent désormais des suites personnalisées avec cas limites, refus et scénarios critiques.
Un agent Stock Pilot surchargé (prompt de 400 lignes, 12 outils) a vu ses performances chuter à 62 %. Une refonte radicale — simplification des prompts, réduction des outils, meilleure orchestration — a permis d’atteindre 92 %. Le problème venait surtout d’une surcharge de contexte et d’instructions contradictoires. La leçon : la complexité non maîtrisée dégrade directement la qualité.
AirOps introduit Quill, un agent IA dédié à la stratégie de contenu. Il exploite données de marque, recherche et guidelines pour produire du contenu optimisé pour ChatGPT, Claude et Gemini. L’approche abandonne les workflows complexes au profit de systèmes orientés documents. Objectif : améliorer visibilité, taux de citation et part de voix dans la recherche IA.
Le langage AshPL formalise les workflows d’agents pour garantir traçabilité et cohérence. Il impose des processus lisibles, inspectables et reproductibles, au-delà du simple résultat final. Cette approche privilégie le mécanisme plutôt que la sortie brute. Elle répond aux exigences de rigueur dans des domaines critiques comme la recherche scientifique.
Le codage assisté par IA déplace la contrainte principale vers la vérification plutôt que la production. Génération, tests et refactoring deviennent rapides, mais la validation devient critique. Des pratiques comme le test-driven development gagnent en pertinence grâce à l’automatisation. Les organisations abandonnent progressivement des პროცესus hérités devenus inefficaces.