ENFR

Tech • IA • Crypto

Aujourd'hui Veille Vidéos Top 24h Crypto Archives Favoris Topics

Mémoire et rêve pour des agents auto-apprenants

8/10

AnthropicClaude8 mai 2026 à 18:4923:41

Lecteur audio

0:00 / 0:00

INTRO

Anthropic a introduit un nouveau système de mémoire ainsi qu’un processus complémentaire appelé Dreaming afin de permettre aux agents IA d’apprendre en continu, de partager des connaissances et d’améliorer leurs performances au fil du temps.

POINTS CLÉS

Memory as a Core AI Primitive

Anthropic positionne la mémoire comme le prochain élément fondamental des agents IA avancés, aux côtés des outils et des compétences. L’objectif est de permettre un auto-apprentissage continu, afin que les agents conservent des connaissances sur les tâches, les environnements et les erreurs passées. Cette évolution corrige les limites des tâches longues où le contexte et l’apprentissage étaient jusqu’ici fragmentés ou perdus.

From Static Context to Self-Learning Agents

Le nouveau système permet aux agents de stocker des informations comme les critères de réussite, les stratégies échouées et les schémas opérationnels. Avec le temps, ils affinent leur comportement en s’appuyant sur l’expérience accumulée, ce qui permet des systèmes qui s’améliorent de manière autonome sans dépendre uniquement du réentraînement ou de l’intervention humaine.

File-System-Based Memory Design

La mémoire est structurée comme un système de fichiers hiérarchique que les agents peuvent gérer directement. À l’aide d’outils familiers, ils peuvent créer, mettre à jour et organiser des fichiers dynamiquement. Cette approche s’appuie sur les progrès de modèles comme Claude Opus 4.7, capables de décider quelles informations conserver et comment les structurer efficacement.

Built for Multi-Agent Environments

Le système est conçu pour des environnements où des centaines ou des milliers d’agents opèrent simultanément. Des fonctionnalités comme les périmètres de permission permettent un accès en lecture seule ou en lecture-écriture à différentes mémoires, tandis que des mécanismes de concurrence optimiste évitent les conflits lors des mises à jour partagées.

Enterprise Controls and Transparency

Pour un usage en production, la plateforme inclut historique des versions, journaux d’audit et métadonnées d’attribution. Les développeurs peuvent suivre qui a effectué des modifications, quand et lesquelles. Une API dédiée permet aussi l’intégration avec des systèmes externes pour des tâches comme le filtrage des données sensibles (PII), le nettoyage de la mémoire et la réplication.

Performance Gains in Early Adoption

Les premiers utilisateurs signalent des gains significatifs. Rakuten a réduit de 90 % les erreurs initiales de ses agents de connaissance internes, tout en améliorant l’efficacité des tokens, les coûts et la latence. Ces progrès proviennent de la capacité des agents à apprendre de leurs erreurs et à partager ces apprentissages.

Introduction of Dreaming

Anthropic a présenté Dreaming, un processus asynchrone qui analyse l’activité passée des agents pour améliorer la qualité de la mémoire. Il examine les transcripts entre sessions, identifie des motifs et met à jour les mémoires avec des informations consolidées, sans ajouter de latence pendant les tâches actives.

Cross-Agent Learning at Scale

Dreaming permet un apprentissage à l’échelle du système en détectant des tendances invisibles pour un agent seul. Par exemple, il peut repérer des échecs récurrents ou des inefficacités et intégrer ces insights dans une mémoire partagée pour améliorer les performances globales.

Significant Benchmark Improvements

Lors des premiers tests, Harvey a observé une multiplication par six du taux de réussite des tâches sur un benchmark juridique après l’intégration de Dreaming, montrant l’impact de l’agrégation des apprentissages.

Memory as a Scalable Knowledge Base

La combinaison de la mémoire et de Dreaming transforme un simple stockage de contexte en une base de connaissances évolutive et continuellement mise à jour. Ce système peut croître avec les déploiements en entreprise tout en restant efficace grâce à des mises à jour structurées et indexées.

Real-World Operational Example

Dans une démonstration, des agents de fiabilité des sites ont partagé leurs analyses via la mémoire lors d’alertes. Les agents suivants ont évité des investigations redondantes, améliorant l’efficacité. Dreaming a ensuite consolidé ces informations, supprimé les doublons et identifié des problèmes systémiques comme des délais liés à des logiques de réessai.

CONCLUSION

Les systèmes de mémoire et Dreaming d’Anthropic marquent une évolution vers des agents IA capables d’apprendre de manière cumulative et collaborative, rendant leur fonctionnement plus efficace, évolutif et autonome dans des environnements complexes.

Transcription complète

Sur le même sujet : Anthropic