LinkedIn présente son agent de mémoire cognitive…

38

1MarkTechPost

Créer une couche de mémoire à long terme universelle pour les agents IA avec Mem0 et OpenAI

Des chercheurs et développeurs s'appuient désormais sur Mem0, une bibliothèque open source compatible avec les modèles OpenAI et la base de données vectorielle ChromaDB, pour construire une couche de mémoire persistante destinée aux agents d'intelligence artificielle. Le principe repose sur une architecture en plusieurs modules : extraction automatique de souvenirs structurés à partir de conversations naturelles, stockage sémantique dans ChromaDB via les embeddings text-embedding-3-small, récupération contextuelle par recherche vectorielle, et intégration directe dans les réponses générées par GPT-4.1-nano. Concrètement, le système segmente les échanges conversationnels en faits durables associés à un identifiant utilisateur, comme les préférences techniques, les projets en cours ou les informations personnelles, puis les rend disponibles lors des interactions futures via une API CRUD complète permettant d'ajouter, modifier, supprimer ou interroger ces souvenirs. Cette approche résout un problème fondamental des agents IA actuels : leur amnésie entre les sessions. Sans mémoire persistante, chaque conversation repart de zéro, obligeant l'utilisateur à reformuler son contexte à chaque échange. Avec ce type d'architecture, un agent peut se souvenir qu'un utilisateur est ingénieur logiciel, qu'il travaille sur un pipeline RAG pour une fintech, et qu'il préfère VS Code en mode sombre, sans que ces informations aient été répétées. Pour les entreprises qui déploient des assistants IA internes, des copilotes de code ou des outils de support client, cela représente un gain de personnalisation et d'efficacité considérable. L'isolation multi-utilisateurs intégrée dans Mem0 garantit par ailleurs que les souvenirs d'un profil ne contaminent pas ceux d'un autre. La mémoire à long terme est l'un des chantiers prioritaires de l'IA générative en 2025-2026, aux côtés du raisonnement et de l'utilisation d'outils. Des acteurs comme OpenAI avec la mémoire de ChatGPT, ou des startups spécialisées telles que Mem0 (anciennement EmbedChain), se positionnent sur ce marché en pleine expansion. L'approche présentée ici est dite "production-ready" : elle exploite ChromaDB en local pour réduire les coûts et la latence, mais reste compatible avec des backends cloud. La tendance de fond est de faire évoluer les agents d'un mode sans état vers une continuité contextuelle, condition nécessaire pour des assistants véritablement utiles sur la durée. Les prochaines étapes probables incluent la gestion de la decay mémorielle (oublier les informations obsolètes) et l'intégration dans des frameworks multi-agents comme LangGraph ou AutoGen.

💬 Le problème de l'amnésie entre sessions, c'est le truc qui rend les agents inutilisables en vrai. Mem0 propose une architecture propre pour ça, avec ChromaDB en local et une isolation multi-utilisateurs qui tient la route, ce qui évite les bricolages maison qu'on voit partout. Bon, "production-ready" ça se vérifie, mais l'approche est solide.

OutilsOutil

1 source

Memori : une mémoire persistante pour agents LLM

35

2MarkTechPost

Memori : une mémoire persistante pour agents LLM

Memori s'impose comme une couche d'infrastructure mémoire native pour les agents LLM, permettant aux applications d'intelligence artificielle de conserver et d'isoler le contexte utilisateur à travers plusieurs sessions et identités. Un tutoriel publié cette semaine détaille son implémentation concrète dans un environnement Google Colab, en connectant Memori à des clients OpenAI synchrones et asynchrones via le modèle gpt-4o-mini. La bibliothèque, disponible dès la version 3.3.0, s'installe en quelques lignes aux côtés du SDK OpenAI et de Nest AsyncIO. Le principe central repose sur l'enregistrement des clients LLM auprès de Memori, qui intercepte alors automatiquement chaque appel de complétion pour y injecter ou y stocker des informations contextuelles. L'attribution de la mémoire se fait par paire entity\id et process\id : deux paramètres qui définissent à quel utilisateur et à quel rôle d'agent appartient chaque fragment d'information. Ce mécanisme résout un problème fondamental des applications LLM actuelles : l'amnésie entre les sessions. Sans infrastructure mémoire, chaque conversation repart de zéro, forçant l'utilisateur à répéter son contexte à chaque interaction. Avec Memori, un assistant personnel se souvient qu'Alice est allergique aux cacahuètes, aime la cuisine italienne et pratique la randonnée, même si la session a été fermée puis rouverte. Plus crucial encore, le système garantit l'isolation des données entre utilisateurs : les informations de Bob, développeur Rust basé à Berlin et végétarien, ne fuient pas dans la mémoire d'Alice, et inversement. Cette séparation multi-tenant est essentielle pour tout service IA destiné à plusieurs clients ou utilisateurs distincts, que ce soit un chatbot de support client, un assistant professionnel ou une application grand public. Le tutoriel illustre également des cas d'usage plus avancés : réponses en streaming, appels asynchrones et simulation d'un agent de support client multi-tours, autant de scénarios qui testent la robustesse de la couche mémoire dans des conditions proches de la production. Memori propose un niveau gratuit avec limitation de débit, ainsi qu'un accès authentifié via clé API pour les usages intensifs. Cette approche s'inscrit dans une tendance plus large de l'écosystème IA : doter les agents de capacités de persistance et de personnalisation sans que les développeurs aient à construire eux-mêmes des systèmes de stockage et de récupération vectorielle. Des projets comme LangMem, Zep ou MemGPT explorent le même territoire, mais Memori mise sur une intégration transparente via simple enregistrement du client OpenAI, réduisant la friction d'adoption pour les équipes déjà familiarisées avec le SDK standard d'OpenAI.

OutilsOutil

1 source

Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application

48

3The Information AI

Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application

La startup d'IA Cognition annonce ce mardi une refonte majeure de son application, transformant Windsurf, rachetée l'année dernière, en un nouvel outil baptisé Devin Desktop. Ce changement de nom est une référence à Devin, l'agent phare de Cognition, mais la plateforme va bien au-delà : elle est désormais conçue pour gérer des agents de coding provenant de multiples fournisseurs, dont OpenAI et Anthropic. L'annonce intervient le même jour qu'un événement organisé par OpenAI pour présenter ses propres offres enterprise et ses outils de coding. L'ambition de Cognition est de se positionner comme une plateforme neutre, comparable à la Suisse dans le jeu géopolitique de l'IA : un terrain commun où les agents de différents éditeurs peuvent coexister sans que l'utilisateur soit contraint de choisir un seul écosystème. Cette neutralité pourrait s'avérer décisive dans un marché du coding assisté par IA de plus en plus saturé, où les développeurs jonglent avec plusieurs outils selon leurs besoins. En agrégeant les agents d'OpenAI, d'Anthropic et potentiellement d'autres acteurs, Cognition cherche à devenir la couche d'orchestration incontournable. La manœuvre illustre une tension structurelle qui traverse tout le secteur : les grands laboratoires comme OpenAI et Anthropic fournissent les modèles qui font tourner les startups de coding, mais concurrencent désormais directement ces mêmes startups avec leurs propres agents. Cognition, comme ses rivaux Cursor ou GitHub Copilot, doit donc trouver une valeur ajoutée qui ne soit pas immédiatement reproductible par ses propres fournisseurs de modèles. Parier sur la neutralité et l'interopérabilité est une réponse stratégique à cette pression, en espérant que les entreprises préfèrent une interface unifiée à la multiplication des abonnements et des interfaces propriétaires.

OutilsOutil

1 source

Les agents IA apprennent en cours de tâche, mais pas pour toute l'équipe

39

4VentureBeat AI

Les agents IA apprennent en cours de tâche, mais pas pour toute l'équipe

Les agents d'intelligence artificielle peinent à devenir de véritables outils d'équipe. Selon une étude interne d'Asana, 75 % des travailleurs du savoir utilisent déjà l'IA au quotidien, mais seulement 5 % des entreprises déclarent en avoir tiré des gains de productivité mesurables. La raison principale : lorsqu'un collaborateur corrige ou améliore un agent, en affinant ses instructions, en lui fournissant un contexte plus précis, cette amélioration s'évapore dès qu'un collègue ouvre le même outil. Chaque utilisateur repart de zéro, entraînant en pratique une version différente du même agent selon la personne qui l'interroge. Arnab Bose, directeur produit d'Asana, résume le problème : les fournisseurs de modèles progressent rapidement sur le raisonnement et les boucles de correction, mais échouent à intégrer le contexte de travail d'entreprise d'une manière intelligible et partageable entre humains. Ce défaut architectural a des conséquences concrètes dans les workflows multi-agents, devenus la norme dans les grandes organisations : des agents qui se contredisent, des tâches répétées inutilement, des versions incohérentes de la réalité selon les équipes. Sriharsha Chintalapani, cofondateur et directeur technique de Collate, souligne que les agents sont extrêmement sensibles à la qualité des instructions reçues : un utilisateur expérimenté obtient de meilleurs résultats parce qu'il formule des prompts plus précis et donne de meilleurs retours correctifs, que l'agent mémorise et applique aux interactions suivantes. Ce mécanisme fonctionne bien pour un usage individuel, mais devient un avantage inégalement distribué dès qu'il s'agit d'un usage collectif. Neej Gore, directeur des données de Zeta Global, défend l'idée d'une mémoire partagée qui agirait comme une intelligence composée, s'enrichissant à chaque interaction et bénéficiant à toute l'organisation. La réponse d'Asana consiste à placer la mémoire partagée au coeur de sa plateforme Agentic Work Management : toute correction apportée par un membre de l'équipe s'applique automatiquement à l'ensemble des utilisateurs, via un graphe de contexte injecté directement dans les agents opérant dans son système. Plus besoin que chaque collaborateur maîtrise l'ingénierie des prompts. Mais la question de qui contrôle cette mémoire, ce qui y est stocké et comment elle reste cohérente quand plusieurs agents et utilisateurs y écrivent simultanément reste largement sans réponse dans l'industrie. Chintalapani avance que la piste la plus prometteuse consiste à construire des agents capables de récupérer la mémoire de manière relationnelle, en fonction du contexte précis de chaque requête, une approche que seules quelques organisations disposant de ressources importantes sont aujourd'hui en mesure de mettre en oeuvre.

UELes entreprises européennes déployant des agents IA en équipe font face au même problème architectural de mémoire non partagée, mais aucune réponse réglementaire ou solution propre au marché France/UE n'est évoquée.

OutilsOutil

1 source

LinkedIn présente son agent de mémoire cognitive pour les agents IA

À lire aussi

Créer une couche de mémoire à long terme universelle pour les agents IA avec Mem0 et OpenAI

Memori : une mémoire persistante pour agents LLM

Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application

Les agents IA apprennent en cours de tâche, mais pas pour toute l'équipe