Aller au contenu principal
OutilsInfoQ AI6sem

LinkedIn présente son agent de mémoire cognitive pour les agents IA

Résumé IASource uniqueImpact UE
Source originale ↗·

LinkedIn a dévoilé le Cognitive Memory Agent (CMA), une couche d'infrastructure d'IA générative destinée à rendre les systèmes d'intelligence artificielle persistants et conscients du contexte dans lequel ils opèrent. Ce framework fournit une mémoire durable organisée en trois couches distinctes : épisodique, qui retient les interactions passées ; sémantique, qui stocke les connaissances générales ; et procédurale, qui encode les comportements appris. Le CMA prend également en charge la coordination entre plusieurs agents, la récupération d'informations et la gestion complète du cycle de vie des mémoires.

Cette initiative s'attaque à une limitation fondamentale des grands modèles de langage : leur absence d'état entre les sessions. Sans mémoire externe, chaque interaction repart de zéro, rendant impossible toute personnalisation durable. En déployant le CMA dans ses propres applications, LinkedIn ouvre la voie à des assistants IA capables de se souvenir des préférences professionnelles d'un utilisateur, de ses recherches d'emploi passées ou de ses habitudes de networking, transformant ainsi l'expérience sur une plateforme de plus d'un milliard d'utilisateurs.

La mémoire des agents est devenue l'un des chantiers prioritaires de l'industrie, alors que les entreprises cherchent à faire passer leurs systèmes d'IA du mode réactif au mode autonome et continu. OpenAI, Google DeepMind et Anthropic développent des architectures comparables, mais LinkedIn dispose d'un avantage singulier : une base de données professionnelles sans équivalent. Le CMA positionne l'entreprise pour intégrer ces capacités directement dans ses outils de recrutement, de formation et de recommandation, avec des implications profondes sur la façon dont les professionnels interagiront avec l'IA au quotidien.

Impact France/UE

Les millions de professionnels français inscrits sur LinkedIn pourraient voir leurs interactions avec les outils de recrutement et de formation de la plateforme profondément transformées par cette couche de mémoire persistante.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost 

Créer une couche de mémoire à long terme universelle pour les agents IA avec Mem0 et OpenAI

Des chercheurs et développeurs s'appuient désormais sur Mem0, une bibliothèque open source compatible avec les modèles OpenAI et la base de données vectorielle ChromaDB, pour construire une couche de mémoire persistante destinée aux agents d'intelligence artificielle. Le principe repose sur une architecture en plusieurs modules : extraction automatique de souvenirs structurés à partir de conversations naturelles, stockage sémantique dans ChromaDB via les embeddings text-embedding-3-small, récupération contextuelle par recherche vectorielle, et intégration directe dans les réponses générées par GPT-4.1-nano. Concrètement, le système segmente les échanges conversationnels en faits durables associés à un identifiant utilisateur, comme les préférences techniques, les projets en cours ou les informations personnelles, puis les rend disponibles lors des interactions futures via une API CRUD complète permettant d'ajouter, modifier, supprimer ou interroger ces souvenirs. Cette approche résout un problème fondamental des agents IA actuels : leur amnésie entre les sessions. Sans mémoire persistante, chaque conversation repart de zéro, obligeant l'utilisateur à reformuler son contexte à chaque échange. Avec ce type d'architecture, un agent peut se souvenir qu'un utilisateur est ingénieur logiciel, qu'il travaille sur un pipeline RAG pour une fintech, et qu'il préfère VS Code en mode sombre, sans que ces informations aient été répétées. Pour les entreprises qui déploient des assistants IA internes, des copilotes de code ou des outils de support client, cela représente un gain de personnalisation et d'efficacité considérable. L'isolation multi-utilisateurs intégrée dans Mem0 garantit par ailleurs que les souvenirs d'un profil ne contaminent pas ceux d'un autre. La mémoire à long terme est l'un des chantiers prioritaires de l'IA générative en 2025-2026, aux côtés du raisonnement et de l'utilisation d'outils. Des acteurs comme OpenAI avec la mémoire de ChatGPT, ou des startups spécialisées telles que Mem0 (anciennement EmbedChain), se positionnent sur ce marché en pleine expansion. L'approche présentée ici est dite "production-ready" : elle exploite ChromaDB en local pour réduire les coûts et la latence, mais reste compatible avec des backends cloud. La tendance de fond est de faire évoluer les agents d'un mode sans état vers une continuité contextuelle, condition nécessaire pour des assistants véritablement utiles sur la durée. Les prochaines étapes probables incluent la gestion de la decay mémorielle (oublier les informations obsolètes) et l'intégration dans des frameworks multi-agents comme LangGraph ou AutoGen.

💬 Le problème de l'amnésie entre sessions, c'est le truc qui rend les agents inutilisables en vrai. Mem0 propose une architecture propre pour ça, avec ChromaDB en local et une isolation multi-utilisateurs qui tient la route, ce qui évite les bricolages maison qu'on voit partout. Bon, "production-ready" ça se vérifie, mais l'approche est solide.

OutilsOutil
1 source
Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application
2The Information AI 

Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application

La startup d'IA Cognition annonce ce mardi une refonte majeure de son application, transformant Windsurf, rachetée l'année dernière, en un nouvel outil baptisé Devin Desktop. Ce changement de nom est une référence à Devin, l'agent phare de Cognition, mais la plateforme va bien au-delà : elle est désormais conçue pour gérer des agents de coding provenant de multiples fournisseurs, dont OpenAI et Anthropic. L'annonce intervient le même jour qu'un événement organisé par OpenAI pour présenter ses propres offres enterprise et ses outils de coding. L'ambition de Cognition est de se positionner comme une plateforme neutre, comparable à la Suisse dans le jeu géopolitique de l'IA : un terrain commun où les agents de différents éditeurs peuvent coexister sans que l'utilisateur soit contraint de choisir un seul écosystème. Cette neutralité pourrait s'avérer décisive dans un marché du coding assisté par IA de plus en plus saturé, où les développeurs jonglent avec plusieurs outils selon leurs besoins. En agrégeant les agents d'OpenAI, d'Anthropic et potentiellement d'autres acteurs, Cognition cherche à devenir la couche d'orchestration incontournable. La manœuvre illustre une tension structurelle qui traverse tout le secteur : les grands laboratoires comme OpenAI et Anthropic fournissent les modèles qui font tourner les startups de coding, mais concurrencent désormais directement ces mêmes startups avec leurs propres agents. Cognition, comme ses rivaux Cursor ou GitHub Copilot, doit donc trouver une valeur ajoutée qui ne soit pas immédiatement reproductible par ses propres fournisseurs de modèles. Parier sur la neutralité et l'interopérabilité est une réponse stratégique à cette pression, en espérant que les entreprises préfèrent une interface unifiée à la multiplication des abonnements et des interfaces propriétaires.

OutilsOutil
1 source
Amazon Bedrock AgentCore : créer des agents IA pour le support métier
3AWS ML Blog 

Amazon Bedrock AgentCore : créer des agents IA pour le support métier

Works Human Intelligence (WHI), éditeur japonais du système RH intégré "COMPANY" utilisé par de grandes entreprises et organismes publics nippons, a collaboré avec le AWS Generative AI Innovation Center (GenAIIC) pour développer deux agents d'IA reposant sur Amazon Bedrock AgentCore. Le premier, le Commuting Allowance Agent, automatise la validation des demandes d'indemnités de transport lors d'événements comme les déménagements d'employés. Le second, le Browser Operation Agent, accède au système "COMPANY" au nom des clients pour vérifier des contenus, effectuer des opérations et collecter des preuves. Le résultat le plus marquant de cette collaboration est une réduction des coûts allant jusqu'à 97 %, combinée à une amélioration mesurable de l'efficacité opérationnelle des équipes support. Pour les départements RH de grandes organisations, la gestion quotidienne d'un système comme "COMPANY" génère un volume considérable de tâches répétitives : changements organisationnels, révisions des politiques salariales, mises à jour d'informations employés. L'automatisation via des agents d'IA permet de décharger les équipes opérationnelles de ces traitements routiniers, libérant du temps pour des missions à plus forte valeur ajoutée. La réduction de 97 % des coûts illustre concrètement ce que peut apporter une architecture bien conçue : WHI auto-hébergeait auparavant Langfuse pour surveiller ses agents, ce qui entraînait des coûts d'exploitation récurrents. La migration vers AgentCore Observability a supprimé cette charge. Pour l'industrie RH, ce cas démontre qu'il est possible de déployer des agents multi-tenants fiables, avec authentification via Amazon Cognito et gestion des tenants par Amazon DynamoDB, sans infrastructure monolithique difficile à faire évoluer. WHI avait initialement lancé un proof of concept avec LangGraph, Amazon ECS et AWS Fargate, mais la mise en disponibilité générale d'Amazon Bedrock AgentCore en cours de projet a conduit l'équipe à repenser l'architecture. Plutôt que de maintenir un ECS task monolithique où tous les composants s'exécutaient en bloc, la nouvelle architecture décompose les sous-agents pour les faire tourner individuellement sur l'AgentCore Runtime, ce qui facilite leur évolution future indépendante. Slack a été intégré comme point d'entrée, avec une authentification déclenchée au moment de chaque appel. WHI envisage également de remplacer l'agent superviseur actuel par Strands Agents à terme. Ce projet illustre une tendance croissante : les éditeurs de logiciels métier cherchent à enrichir leurs solutions avec des couches d'IA agentique en s'appuyant sur des services cloud managés pour absorber la complexité opérationnelle, plutôt que de maintenir leur propre outillage d'orchestration.

OutilsOutil
1 source
Google Pay se prépare pour les agents IA avec le Universal Commerce Protocol
4AI News 

Google Pay se prépare pour les agents IA avec le Universal Commerce Protocol

Google Pay annonce une refonte majeure de son infrastructure de paiement pour anticiper l'essor des transactions initiées par des agents d'intelligence artificielle. L'entreprise a présenté le Universal Commerce Protocol (UCP), une nouvelle spécification destinée à standardiser la communication entre agents IA, systèmes de paiement et marchands. En parallèle, Google déploie un nouveau serveur baptisé Merchant Commerce Platform (MCP), qui fait office d'intermédiaire entre les développeurs d'agents et les backends commerciaux. D'autres composants complètent ce dispositif : des callbacks dynamiques pour l'API Android Pay, permettant des ajustements en temps réel pendant une transaction (recalcul des frais de livraison, mise à jour de la TVA), ainsi qu'une extension du support WebView pour autoriser des paiements natifs au sein d'applications tierces comme les réseaux sociaux. Ce basculement répond à un problème concret : les agents IA conçus pour réserver des vols, commander des fournitures ou effectuer des achats en ligne sont incapables de naviguer dans des tunnels de conversion pensés pour des humains, avec leurs clics, leurs formulaires et leurs pages de confirmation visuelles. En remplaçant ce modèle par une API stable et lisible par les machines, Google cherche à s'imposer comme la plaque tournante du commerce machine-à-machine. Pour les entreprises, les implications sont immédiates : si leurs données produits, leurs prix et leurs stocks ne sont pas exposés sous forme de données structurées exploitables par un agent, elles deviennent invisibles dans ce nouveau canal commercial. Le référencement ne se fera plus uniquement pour les humains, mais aussi pour les algorithmes qui décident des achats à leur place. Ce repositionnement intervient alors que l'ensemble de l'industrie tech anticipe une explosion des transactions autonomes. En centralisant les flux via son serveur MCP, Google obtient une vue privilégiée sur les tendances commerciales générées par les agents IA, ce qui soulève des questions de gouvernance des données et de dépendance à une plateforme propriétaire. Sur le plan de la sécurité, Google introduit une authentification biométrique inter-appareils : un agent peut demander à l'utilisateur de valider un achat depuis son téléphone, même si la transaction a été orchestrée depuis un ordinateur. Ce mécanisme établit un modèle de supervision humaine pour les transactions sensibles, mais la question de savoir quand un agent peut agir de façon entièrement autonome reste ouverte et sera probablement au cœur des prochains débats réglementaires et industriels.

UELes marchands européens devront exposer leurs données produits, prix et stocks en format structuré exploitable par les agents IA sous peine de devenir invisibles dans ce nouveau canal commercial, avec en toile de fond une dépendance à une infrastructure propriétaire américaine soulevant des questions de gouvernance des données sensibles à la réglementation européenne.

💬 Le vrai angle ici, c'est pas le protocole, c'est que les agents IA ne savent pas passer en caisse. Google règle ça, et du même coup devient incontournable pour tout le commerce machine-à-machine. Les marchands qui n'ont pas encore leurs données produits en format structuré viennent d'hériter d'un nouveau chantier.

OutilsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour