ENFR

Tech • IA • Crypto

Aujourd'hui Topics Vidéos Crypto Archives Favoris

Mémoire et rêve pour agents auto-apprenants

9/10

AnthropicClaude21 mai 2026 à 16:4921:28

Lecteur audio

0:00 / 0:00

INTRO

Anthropic a introduit de nouveaux systèmes de mémoire et de « dreaming » conçus pour aider les agents d’IA à apprendre d’une tâche à l’autre, améliorant leurs performances au fil du temps et à grande échelle.

POINTS CLÉS

Les agents gagnent en capacité et en durée

Les agents d’IA peuvent désormais gérer des tâches de plus en plus complexes sur des périodes prolongées, la recherche indiquant que la durée des tâches qu’ils peuvent traiter double environ tous les sept mois. Ce progrès rapide met en lumière une limite majeure: maintenir un contexte utile sur des tâches longues ou répétées reste difficile. Sans apprentissage persistant, les agents repartent en pratique de zéro à chaque fois.

La mémoire permet un apprentissage continu

Le nouveau système de mémoire permet aux agents de conserver et de réutiliser les connaissances issues de tâches précédentes, améliorant les résultats au fil du temps. Plutôt que des performances isolées, les agents apprennent de leurs erreurs, réutilisent des stratégies efficaces et partagent des enseignements entre environnements, créant un effet cumulatif.

Une conception basée sur des fichiers alignée avec les forces des modèles

La mémoire est structurée comme un système de fichiers, tirant parti de la capacité des modèles à naviguer, lire et modifier des fichiers avec des outils familiers. Cette approche réduit les frictions et permet d’organiser l’information naturellement, tout en laissant aux agents la flexibilité de décider quoi stocker et comment.

Collaboration multi‑agents via une mémoire partagée

Le système prend en charge une mémoire partagée entre plusieurs agents, facilitant la collaboration au sein et entre les environnements. Des niveaux d’accès différenciés — mémoire organisationnelle en lecture seule, espaces lecture‑écriture spécifiques aux tâches — créent une hiérarchie évolutive.

Contrôles et observabilité pour l’entreprise

Des garde‑fous intégrés incluent contrôle de version, journaux d’audit et attribution, permettant de suivre l’évolution de la mémoire et l’origine des modifications. Une API autonome facilite l’intégration, avec des fonctions d’export et de caviardage adaptées aux exigences des entreprises.

Gains mesurés en production

Les premiers utilisateurs signalent des améliorations notables. Rakuten a obtenu une réduction de 97 % des erreurs au premier passage, tandis que Wise Docs a diminué les problèmes récurrents dans la vérification de documents.

Limites de l’optimisation locale de la mémoire

À mesure que les systèmes se développent, des problèmes apparaissent: duplication des connaissances, informations fragmentées, et apprentissages redondants entre agents. Les mises à jour sont souvent optimales localement mais manquent de coordination globale.

Le « dreaming » introduit une optimisation globale

Le processus de dreaming agit comme une boucle de rétroaction analysant l’activité entre agents et sessions. Il identifie des schémas, erreurs récurrentes et inefficacités, puis réorganise et améliore la mémoire, sans ajouter de latence aux tâches actives.

Gains démontrés du dreaming

Les premiers résultats sont marquants: Harvey rapporte une multiplication par six des taux de complétion sur des benchmarks juridiques. En synthétisant les apprentissages sur plusieurs exécutions, le dreaming permet un progrès à l’échelle du système.

Une architecture découplée qui améliore les performances

Le dreaming fonctionne en dehors de la boucle principale, permettant aux agents de se concentrer sur les tâches tandis que l’optimisation se fait en parallèle. Il peut être déclenché par des événements ou des planifications et traite plusieurs sessions simultanément.

Application concrète en gestion d’incidents

Dans un déploiement, des agents gérant des alertes système ont utilisé une mémoire partagée pour coordonner leurs réponses. Lorsqu’un agent identifiait une correction en cours, les autres adaptaient leurs actions. Le dreaming a ensuite détecté des motifs récurrents (ex. alertes après pics CPU) et amélioré la mémoire pour de futures décisions.

Vers des systèmes de connaissance à l’échelle organisationnelle

Ensemble, mémoire et dreaming créent une couche de connaissance en amélioration continue couvrant agents et tâches. La mémoire capture l’expérience, le dreaming l’affine et l’organise, élevant progressivement le niveau de performance global.

CONCLUSION

Les systèmes de mémoire et de dreaming d’Anthropic marquent une évolution vers des agents d’IA capables d’apprendre de manière cumulative et collaborative, ouvrant la voie à une intelligence scalable à l’échelle des organisations.

Transcription complète

Sur le même sujet : Anthropic