Memora : une représentation mémorielle harmonique entre abstraction et précision
Des chercheurs de Microsoft ont présenté Memora à la conférence ICML 2026, un système de mémoire scalable conçu pour les agents IA opérant sur des tâches longues durées. Publiés en open source sur GitHub sous le compte Microsoft, les travaux montrent que Memora établit de nouveaux records sur les benchmarks LoCoMo et LongMemEval, surpassant des systèmes existants comme Mem0, les approches RAG classiques et l'inférence en contexte complet, tout en consommant jusqu'à 98 % moins de tokens de contexte. Le principe central du système est de dissocier ce qui est stocké, c'est-à-dire un contenu riche et expressif comme une chronologie de projet ou une discussion multi-tours, de la manière dont ce contenu est récupéré, via une couche structurelle légère composée d'abstractions et d'ancres de rappel.
L'enjeu est considérable pour quiconque utilise ou développe des assistants IA dans des contextes professionnels. Les grands modèles de langage actuels sont fondamentalement apatrides : chaque session repart de zéro, chaque longue conversation oblige le modèle à relire l'intégralité de son historique, et chaque nouvelle information est soit stockée telle quelle sous forme de texte brut fragmenté, soit compressée en résumé vague qui efface les détails précis. Pour un copilote qui suit un projet pendant plusieurs mois, ou un agent de recherche qui accumule une expertise sur le long terme, cette absence de mémoire structurée est devenue le principal goulot d'étranglement. Memora résout ce problème en permettant à un agent de naviguer dans son propre historique sans tout relire, en consolidant les informations liées en unités stables et en restituant les détails fins uniquement quand ils sont pertinents.
Les approches existantes buttaient toutes sur la même contradiction fondamentale entre spécificité et abstraction. Les systèmes orientés fragmentation de contenu, comme RAG ou Mem0, préservent le détail mais produisent des entrées isolées qui perdent toute cohérence narrative. Les systèmes de compression résument l'expérience en blocs compacts mais sacrifient les contraintes, cas limites et chiffres précis qui rendent une mémoire réellement utile. Les systèmes à base de graphes comme Zep ou GraphRAG ajoutent de la structure mais restent dépendants d'ontologies rigides qui ne se généralisent pas d'un domaine à l'autre. Memora s'inscrit dans une dynamique plus large où l'industrie cherche à doter les agents autonomes d'une continuité cognitive réelle, condition nécessaire pour passer du chatbot ponctuel à l'assistant capable de gérer des missions complexes s'étalant sur des semaines ou des mois. La publication du code en open source suggère que Microsoft entend positionner ce système comme une brique fondamentale de l'écosystème d'agents IA en pleine structuration.
Les développeurs et laboratoires européens travaillant sur des agents IA à longue durée peuvent intégrer directement ce système open source pour améliorer la persistance mémorielle de leurs assistants.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



