InfrastructureVentureBeat AI · 14 juin 2026, 07:00· 2 min de lecture

MCP a résolu l'appel d'outils, A2A la coordination. Et le transport ?

Résumé IASource uniqueImpact UE Take éditorial

En l'espace de dix-huit mois, l'écosystème des agents IA a produit quatre protocoles de communication majeurs qui redessinent en profondeur la façon dont les systèmes d'intelligence artificielle interagissent. Anthropic a lancé le Model Context Protocol (MCP) fin 2024, IBM Research a publié l'Agent Communication Protocol (ACP) en mars 2025, Google a dévoilé Agent2Agent (A2A) en avril 2025, et un groupe de travail indépendant a proposé l'Agent Network Protocol (ANP). En avril 2026, MCP comptait déjà plus de 10 000 serveurs publics actifs et 164 millions de téléchargements mensuels du SDK Python, confirmant sa domination sur la couche d'appel d'outils. Google a cédé A2A à la Linux Foundation en juin 2025. Parallèlement, le W3C a ouvert un groupe communautaire dédié aux protocoles d'agents IA, et l'IETF reçoit des propositions de standards pour le transport entre agents.

Ce qui semblait chaotique révèle en réalité une logique de pile : chaque protocole adresse une couche distincte. MCP est un contrat RPC typé entre un client-modèle et un serveur d'outils, il gère la découverte de fonctions et leur invocation via HTTP. A2A comble ce que MCP laisse ouvert : la coordination de tâches entre agents, avec des "Agent Cards" pour déclarer les capacités, des états de cycle de vie et trois modes d'interaction (synchrone, streaming, asynchrone). ACP, lui, est une enveloppe de message légère et sans état, utile quand la sémantique complète d'A2A serait excessive. ANP apporte identité décentralisée via des DID et descriptions de capacités en JSON-LD, posant les bases de marketplaces d'agents sans registre central. Ces couches se complètent, elles ne se concurrencent pas.

La question non résolue est celle du transport. Tous ces protocoles tournent sur HTTP, un choix qui reflète l'origine de leurs concepteurs : équipes de recherche, fournisseurs d'API, éditeurs enterprise pour qui HTTP est une évidence. Mais HTTP a été conçu pour des échanges requête-réponse entre humains et serveurs, pas pour des flux de tâches longue durée entre agents autonomes. L'histoire des protocoles distribués montre un schéma invariable : prolifération d'abord, consolidation ensuite. CORBA, DCOM, RMI et SOAP se sont battus pour l'intégration enterprise dans les années 1990 avant que REST ne gagne en étant plus simple et natif HTTP. XMPP, IRC et des dizaines de protocoles propriétaires ont fragmenté la messagerie temps réel avant que MQTT et WebSockets ne s'imposent dans leurs niches respectives. L'écosystème IA est aujourd'hui en phase de prolifération. La convergence viendra lorsque l'interopérabilité deviendra une nécessité économique, mais les décisions d'architecture prises maintenant définiront quels protocoles survivront à cette consolidation.

Impact France/UE

La participation des instances européennes aux groupes W3C et IETF sur les protocoles d'agents IA offre une opportunité d'influencer des standards architecturaux qui conditionneront l'écosystème agent pour les années à venir.

💬 L'analyse de Mathieu

La pile MCP/A2A commence à avoir de la gueule : chaque protocole couvre sa couche, sans se marcher dessus. Ce qui reste ouvert, c'est le transport, et c'est pas un détail, parce qu'HTTP n'a pas été conçu pour des tâches autonomes qui durent des heures. La consolidation finira par arriver, comme après SOAP, mais les archi posées maintenant, c'est celles qui resteront.

Dans nos dossiers

Agents IA Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

Google et AWS répartissent la pile des agents IA entre contrôle et exécution

Google et Amazon Web Services viennent de redéfinir leurs approches respectives pour orchestrer les agents IA d'entreprise, révélant une fracture profonde dans la façon de concevoir l'infrastructure agentique. Google a lancé une nouvelle version de Gemini Enterprise, regroupant sous une même bannière sa plateforme Gemini Enterprise et son application éponyme, tout en rebaptisant Vertex AI en Gemini Enterprise Platform. De son côté, AWS a enrichi Bedrock AgentCore d'un système de harness, un dispositif de configuration automatique alimenté par Strands Agents, son framework open source. Ce harness permet aux équipes de définir ce que l'agent doit faire, quel modèle utiliser et quels outils appeler, le reste étant pris en charge automatiquement. Dans le même temps, Anthropic a dévoilé ses Claude Managed Agents et OpenAI a renforcé son Agents SDK, confirmant que l'ensemble de l'industrie cherche simultanément à résoudre le même problème : comment gérer des agents IA qui tournent durablement en production. L'enjeu dépasse la simple question de l'outillage développeur. À mesure que les agents passent de courtes tâches ponctuelles à des workflows autonomes de longue durée, un nouveau type de défaillance émerge : la dérive d'état (state drift). Un agent qui fonctionne en continu accumule de la mémoire, des réponses et un contexte évolutif. Avec le temps, ce contexte devient obsolète : les sources de données changent, les outils renvoient des réponses contradictoires, et l'agent perd en fiabilité sans que personne ne s'en rende forcément compte. C'est ce problème systémique que Google et AWS cherchent à prévenir, par deux chemins opposés. Google mise sur un plan de contrôle à la manière de Kubernetes, centré sur la gouvernance et la visibilité. AWS privilégie la vitesse de déploiement et la simplification de la configuration, en déléguant la coordination à la couche d'exécution. Cette divergence illustre une transformation plus profonde de la pile IA, qui se stratifie désormais en couches spécialisées. Google positionne Gemini Enterprise comme une porte d'entrée unifiée vers l'ensemble de ses systèmes IA, avec des outils de sécurité et de gouvernance inclus dans l'abonnement, selon Maryam Gholami, directrice senior produit chez Google. AWS, Anthropic et OpenAI s'orientent davantage vers la vélocité et la flexibilité d'exécution. La question de savoir quelle approche s'imposera reste ouverte : Gholami elle-même reconnaît que ce sont les clients qui dicteront les usages des agents longue durée, un domaine où les bonnes pratiques restent encore à définir. Le vrai test viendra lorsque les entreprises feront tourner ces systèmes en conditions réelles, avec des agents qui devront remonter de l'information, demander des validations humaines, et résister à la dégradation progressive de leur contexte.

UELes entreprises européennes qui déploient des agents IA en production sur Google Cloud ou AWS devront arbitrer entre les deux approches d'orchestration pour leurs workflows agentiques durables.

InfrastructureOpinion

1 source

2InfoQ AI

Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle

Karthik Ramgopal et Prince Valluri, ingénieurs chez LinkedIn, ont présenté leur approche pour déployer l'intelligence artificielle à grande échelle au sein d'une organisation de plusieurs milliers de développeurs. Plutôt que de laisser chaque équipe construire ses propres solutions en silo, ils ont mis en place une couche d'abstraction commune reposant sur le protocole MCP (Model Context Protocol) pour orchestrer des agents, structurer le contexte et sécuriser l'accès aux outils internes. Cette architecture a permis de déployer concrètement trois types d'agents en production : des agents de génération de code, des agents d'observation système et des agents de test d'interface utilisateur. L'enjeu est considérable pour les grandes entreprises technologiques : sans infrastructure partagée, chaque équipe réinvente la roue et les agents IA restent des expérimentations isolées sans impact à l'échelle. En centralisant l'orchestration et la gestion du contexte via une plateforme commune, LinkedIn parvient à transformer l'IA en véritable moteur d'exécution engineering, capable d'automatiser des tâches complexes comme les tests UI ou la surveillance de systèmes distribués, avec des garanties de sécurité homogènes. Cette initiative s'inscrit dans une tendance de fond : les grandes entreprises tech passent du stade des prototypes d'agents IA à celui des déploiements industriels, ce qui exige des équipes plateformes dédiées. Le protocole MCP, porté initialement par Anthropic et rapidement adopté par l'industrie, s'impose comme standard d'interopérabilité entre agents et outils. LinkedIn, filiale de Microsoft, bénéficie par ailleurs d'un accès privilégié aux modèles GPT-4o via Azure, ce qui accélère ces expérimentations à une échelle que peu d'entreprises peuvent atteindre.

UELes équipes d'ingénierie européennes peuvent s'inspirer de cette architecture MCP pour structurer leurs propres déploiements d'agents IA à l'échelle, le protocole MCP s'imposant comme standard industriel d'interopérabilité.

💬 MCP en prod chez LinkedIn sur des milliers de devs, c'est le signal qu'on attendait pour que le protocole bascule vraiment en standard industriel. Ce qui est intéressant là-dedans, c'est pas la tech en elle-même (Anthropic a bien bossé le design), c'est l'architecture plateforme : une couche commune au lieu que chaque équipe réinvente ses propres outils d'orchestration dans son coin. Reste à voir ce que ça donne pour les boîtes qui n'ont pas Azure et GPT-4o derrière.

InfrastructureOpinion

1 source

3The Decoder

Le code : outil de raisonnement et d'action des agents IA, pas seulement leur production

Un article de synthèse publié récemment soutient que le véritable goulot d'étranglement dans le développement d'agents IA autonomes n'est pas le modèle de langage lui-même, mais la couche logicielle qui l'entoure. Baptisée "harness", cette infrastructure regroupe les outils externes, la mémoire persistante, les systèmes de test et les mécanismes de contrôle des permissions. C'est elle, selon les auteurs, qui transforme un modèle stateless en agent opérationnel. Le laboratoire chinois Deepseek a déjà tiré les conclusions pratiques de cette thèse en montant à Pékin une équipe dédiée exclusivement au développement du harness, avec une formule qui résume tout : modèle plus harness égal agent IA. Cela repose la question fondamentale de la valeur dans l'écosystème IA. Si le modèle seul ne suffit pas, les entreprises qui maîtrisent l'orchestration logicielle autour du modèle, et non uniquement l'entraînement, détiennent un avantage concurrentiel décisif. Pour les développeurs et les équipes produit, cela signifie que construire des agents performants exige autant d'ingénierie système que de puissance brute en paramètres. Cette vision s'inscrit dans une tendance plus large où les grands laboratoires et startups investissent massivement dans les frameworks agentiques. LangChain, LlamaIndex, ou encore les outils natifs d'Anthropic et OpenAI illustrent cette course à l'infrastructure plutôt qu'au modèle. Le mouvement de Deepseek, qui structure une équipe entière autour du harness plutôt que de simplement scaler les paramètres, pourrait annoncer une réorganisation profonde des priorités dans la course à l'IA agentique.

InfrastructureOpinion

1 source

4InfoQ AI

Le maintien d'état pour les agents IA : pourquoi les couches de transport deviennent essentielles

Les agents IA reposent sur des boucles multi-tours et des appels d'outils répétés, ce qui transforme la couche de transport en enjeu critique de performance. Dans un article publié par Anirudh Mendiratta, la technique dite de "stateful continuation" est présentée comme une solution concrète : en maintenant l'état de la session côté serveur plutôt que de le retransmettre à chaque requête, il devient possible de réduire le volume de données envoyées par le client de plus de 80 % et d'améliorer les temps d'exécution de 15 à 29 %. Cet impact est loin d'être marginal. Dans les architectures agentiques, chaque tour de boucle implique de renvoyer l'historique complet de la conversation, les sorties d'outils et les instructions système, ce qui génère une surcharge croissante au fil de l'exécution. La continuation avec état élimine cette redondance en permettant au serveur de reprendre là où il s'est arrêté, sans que le client ait à tout recharger. Pour les systèmes à forte fréquence d'appels ou à contextes longs, le gain en latence et en coût de bande passante devient structurellement significatif. Cette problématique émerge directement de la montée en puissance des agents autonomes, qui diffèrent fondamentalement des usages classiques des LLM en accès direct. Là où une requête unique pouvait tolérer un protocole de transport léger, des workflows de plusieurs dizaines de tours exposent des inefficacités jusqu'ici invisibles. Les frameworks d'orchestration comme LangGraph, AutoGen ou les environnements MCP commencent à intégrer ces considérations, et la gestion du contexte côté serveur pourrait devenir un standard de facto pour les déploiements agentiques à grande échelle.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic