Aller au contenu principal
OutilsInfoQ AI6sem

MCP Dev Summit de l'AAIF : passerelles, gRPC et renforcement des protocoles

Résumé IASource uniqueImpact UE
Source originale ↗·

Le MCP Dev Summit North America 2026 s'est tenu les 2 et 3 avril au New York Marriott Marquis, réunissant environ 1 200 participants autour de l'évolution du Model Context Protocol (MCP). Organisé par l'Agentic AI Foundation, une initiative portée par la Linux Foundation, le sommet a mis en avant les défis concrets de déploiement du MCP en environnement d'entreprise, avec des contributions notables d'Amazon et d'Uber. Les discussions techniques ont porté sur trois axes majeurs : la sécurisation des passerelles (gateways), l'intégration via gRPC, et l'observabilité des protocoles en production.

Ces orientations reflètent une maturité croissante du MCP, qui passe du stade expérimental à des déploiements à grande échelle dans des infrastructures critiques. Pour des entreprises comme Amazon ou Uber, la capacité à faire communiquer des agents IA de manière fiable, sécurisée et traçable devient un impératif opérationnel. L'accent mis sur l'interopérabilité signale que l'écosystème cherche à éviter la fragmentation entre implémentations propriétaires.

Le MCP, initialement proposé par Anthropic fin 2024 comme standard ouvert pour connecter les modèles de langage aux outils et données externes, connaît une adoption accélérée depuis que des acteurs majeurs comme OpenAI et Google ont annoncé leur support. La prise en charge par la Linux Foundation via l'Agentic AI Foundation marque une étape vers sa gouvernance communautaire. Ce sommet illustre que le vrai enjeu n'est plus l'existence du protocole, mais sa robustesse industrielle face aux exigences de sécurité et de scalabilité des grandes organisations.

Impact France/UE

L'adoption du MCP comme standard ouvert sous gouvernance Linux Foundation crée un cadre d'interopérabilité que les entreprises européennes déployant des agents IA devront intégrer dans leurs architectures.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Guide des API, MCP et passerelles MCP
1AI News 

Guide des API, MCP et passerelles MCP

Les interfaces de programmation (API) et le Model Context Protocol (MCP) sont deux mécanismes permettant à des systèmes d'échanger des données, mais leur conception répond à des logiques fondamentalement différentes. Une API connecte deux applications selon un contrat rigide : la requête et la réponse sont toutes deux définies à l'avance dans le code, ce qui rend l'échange précis et prévisible, mais fragile dès qu'une des parties modifie son comportement. Le MCP, lui, a été conçu pour un consommateur d'un genre nouveau : les grands modèles de langage (LLM). Un serveur MCP expose trois types de capacités, des outils (actions que le modèle peut déclencher, comme créer un fichier ou interroger une base de données), des ressources (données lisibles en contexte) et des templates de prompts réutilisables. C'est le modèle lui-même qui décide, en fonction de la requête de l'utilisateur, quels outils ou ressources il juge pertinents. La distinction n'est pas qu'architecturale : elle a des conséquences directes sur les coûts et la précision des réponses de l'IA. Quand un LLM interroge une API classique, celle-ci peut renvoyer cinquante champs d'une fiche client alors que le modèle n'a besoin que du statut d'abonnement. Chaque octet inutile consomme des tokens, alourdit la facture d'inférence et dilue la réponse, le modèle peut s'appuyer sur des données non pertinentes et produire des réponses inexactes. Un outil MCP bien conçu retourne uniquement le nombre de clients abonnés à un service donné, sans envoyer l'historique complet des interactions. Pour les équipes qui déploient des assistants IA en entreprise, ce gain de précision et d'économie n'est pas négligeable sur des volumes de requêtes importants. Le MCP, standardisé par Anthropic en 2024, s'impose progressivement comme une couche d'abstraction centrale dans les architectures d'IA agentiques. Il ne remplace pas les API : dans de nombreux systèmes, un serveur MCP appelle lui-même des API en coulisses, mais filtre et formate les données avant de les transmettre au modèle. Cette approche, parfois désignée sous le terme de "MCP Gateway", permet de centraliser l'accès à de multiples sources de données via une interface unique. Les entreprises qui construisent des agents IA capables d'interroger des bases internes, de lire des documents ou de déclencher des actions métier se tournent de plus en plus vers cette architecture. Le choix entre API et MCP se résume ainsi : une API convient quand deux applications se connaissent parfaitement et échangent des données définies ; le MCP s'impose dès que le consommateur est un modèle d'IA dont les besoins varient selon les requêtes des utilisateurs.

OutilsTuto
1 source
NVIDIA et SAP renforcent la fiabilité des agents spécialisés
2NVIDIA AI Blog 

NVIDIA et SAP renforcent la fiabilité des agents spécialisés

NVIDIA et SAP ont annoncé lors de la conférence SAP Sapphire un renforcement significatif de leur collaboration autour des agents IA autonomes en entreprise. Jensen Huang, fondateur et PDG de NVIDIA, est intervenu par vidéo lors du discours d'ouverture de Christian Klein, PDG de SAP. Le coeur de l'annonce : SAP intègre NVIDIA OpenShell, un runtime open source conçu pour déployer des agents IA autonomes de manière sécurisée, directement dans sa SAP Business AI Platform. Les ingénieurs SAP participent désormais au développement de ce projet open source aux côtés de ceux de NVIDIA. OpenShell fournit des environnements d'exécution isolés, applique des politiques au niveau du système de fichiers et du réseau, et assure une containérisation au niveau de l'infrastructure pour limiter les dégâts en cas de défaillance de la logique d'un agent. Il devient ainsi la couche de sécurité d'exécution pour l'ensemble des agents SAP, y compris ceux créés dans Joule Studio, l'environnement de SAP dédié à la construction et gestion d'agents d'entreprise bout en bout. Ce partenariat répond à un défi concret : quand un agent IA peut accéder à des systèmes critiques, traverser les frontières applicatives et agir sans validation humaine à chaque étape, les entreprises ont besoin de garanties solides avant de le déployer en production. La différence entre un assistant IA et un agent autonome, c'est précisément cette capacité à agir sans supervision constante, ce qui exige des contrôles stricts sur ce que l'agent peut voir, faire, et tracer. Pour des domaines comme la finance, les achats, la supply chain ou la fabrication, où SAP pilote les opérations de milliers d'entreprises mondiales, les enjeux de conformité et de gouvernance sont particulièrement élevés. OpenShell répond à la question « cette action peut-elle s'exécuter en sécurité ? », tandis que la couche de contrôle de Joule Studio répond à « cette action doit-elle avoir lieu du tout ? » SAP occupe une position stratégique dans l'écosystème IA d'entreprise : ses systèmes hébergent les données de référence des processus financiers, logistiques et opérationnels de nombreuses grandes organisations mondiales. NVIDIA est lui-même client SAP pour ses propres opérations financières et supply chain, ce qui donne aux deux entreprises une compréhension commune des exigences de gouvernance en conditions réelles. Pour accélérer le développement d'agents personnalisés, NVIDIA NemoClaw, un plan de référence pour construire et déployer des agents autonomes, sera disponible directement dans Joule Studio, offrant aux équipes de développement un chemin structuré du prototype au déploiement sécurisé en production. Cette collaboration illustre une tendance de fond dans l'industrie : la course à l'adoption des agents IA autonomes passe désormais par la confiance, et c'est au niveau de la couche applicative que se joue l'essentiel de la bataille.

UESAP, entreprise européenne leader des ERP, intègre des couches de sécurité pour agents IA autonomes dans sa plateforme Business AI, ce qui concerne directement les grandes organisations françaises et européennes utilisant SAP pour leurs processus financiers et opérationnels.

OutilsActu
1 source
Surveiller le comportement des LLM : dérives, nouvelles tentatives et patterns de refus
3VentureBeat AI 

Surveiller le comportement des LLM : dérives, nouvelles tentatives et patterns de refus

Les systèmes d'intelligence artificielle générative posent un défi fondamental aux équipes d'ingénierie : contrairement aux logiciels traditionnels, où une entrée A combinée à une fonction B produit toujours un résultat C, les modèles de langage sont stochastiques. Le même prompt peut retourner des réponses différentes d'un lundi à un mardi, rendant caducs les tests unitaires classiques. Pour répondre à ce problème, des équipes spécialisées dans le déploiement d'IA pour des clients Fortune 500 dans des secteurs à hauts risques, où une hallucination n'est pas anecdotique mais constitue un risque de conformité majeur, ont formalisé un cadre structuré : l'AI Evaluation Stack. Ce pipeline d'assertions remplace les simples "vibe checks" subjectifs par une infrastructure d'évaluation rigoureuse organisée en couches distinctes. La première couche repose sur des assertions déterministes, qui traitent en priorité les pannes les plus fréquentes en production : non pas les hallucinations sémantiques, mais les erreurs de syntaxe et de routage. Ces vérifications binaires posent des questions strictes, le modèle a-t-il généré le bon schéma JSON ? A-t-il invoqué le bon appel d'API avec les bons paramètres ? A-t-il correctement renseigné un identifiant GUID ou une adresse email ? Ce principe "fail-fast" est délibérément placé en amont pour éviter de déclencher des évaluations coûteuses sur des sorties déjà mal formées. La seconde couche intervient lorsque la syntaxe est validée : elle évalue la qualité sémantique via ce qu'on appelle le LLM-as-a-Judge, c'est-à-dire un modèle frontier (plus puissant que le modèle de production) chargé d'évaluer la nuance, la politesse ou le caractère actionnable d'une réponse, des dimensions qu'aucune regex ne peut capturer de façon fiable. Ce juge artificiel devient ainsi un proxy scalable de la relecture humaine, capable de traiter des dizaines de milliers de cas de test dans un pipeline CI/CD. Cette architecture répond à une maturité croissante du secteur face aux risques de dérive comportementale des LLMs en production. Dans les industries réglementées, finance, santé, juridique, un modèle qui dévie de ses instructions, refuse des requêtes légitimes ou produit des sorties mal structurées peut engendrer des conséquences opérationnelles et légales sérieuses. Les grandes entreprises technologiques et les startups d'observabilité IA, comme Braintrust, Langfuse ou Weights & Biases, investissent massivement dans ces outils d'évaluation. L'enjeu est de faire passer l'IA générative du statut de prototype impressionnant à celui de composant industriel fiable, soumis aux mêmes exigences de qualité que n'importe quel service critique en production.

UEL'AI Act européen impose une surveillance rigoureuse des systèmes IA à haut risque dans les secteurs réglementés (finance, santé, juridique), ce cadre d'évaluation structuré répond directement aux exigences de traçabilité et de conformité que devront démontrer les entreprises européennes déployant des LLMs en production.

OutilsOutil
1 source
Amazon Bedrock propose l'ajustement par renforcement via des API compatibles OpenAI : guide technique
4AWS ML Blog 

Amazon Bedrock propose l'ajustement par renforcement via des API compatibles OpenAI : guide technique

Amazon Bedrock, la plateforme cloud d'IA d'AWS, propose depuis décembre 2025 le Reinforcement Fine-Tuning (RFT), une méthode avancée de personnalisation de modèles de langage. Le service a d'abord été lancé avec les modèles Nova d'Amazon, avant d'être étendu en février 2026 aux modèles open source comme OpenAI GPT OSS 20B et Qwen 3 32B. Concrètement, le RFT permet d'entraîner un modèle à partir d'un petit ensemble de prompts — sans avoir besoin de milliers d'exemples étiquetés — en lui faisant générer plusieurs réponses possibles, puis en lui attribuant des scores selon la qualité de chaque réponse. Le modèle apprend ensuite à privilégier les stratégies qui produisent les meilleurs résultats. L'exemple utilisé dans le tutoriel est le dataset mathématique GSM8K, appliqué au modèle gpt-oss-20B hébergé sur Bedrock. Ce qui distingue le RFT du fine-tuning supervisé classique, c'est sa capacité d'apprentissage en boucle fermée : le modèle génère lui-même les réponses sur lesquelles il s'entraîne, plutôt que de mémoriser des paires entrée-sortie figées. Cette approche est particulièrement puissante pour des tâches vérifiables comme les mathématiques ou la génération de code, où la correction peut être évaluée automatiquement sans intervention humaine. Au fil de l'entraînement, le modèle rencontre naturellement des scénarios de plus en plus complexes, ce qui lui permet de s'améliorer en continu sans que l'équipe doive constituer et annoter un dataset massif en amont. Le résultat : des gains de performance significatifs sur des tâches complexes comme le raisonnement logique ou les conversations multi-tours. Le Reinforcement Learning appliqué aux LLMs est la technique qui a permis à des modèles comme ChatGPT d'aligner leurs réponses sur les préférences humaines — une méthode connue sous le nom de RLHF. Amazon Bedrock l'industrialise ici en automatisant tout le pipeline, de l'authentification au déploiement d'une fonction de récompense via Lambda, jusqu'à l'inférence sur le modèle personnalisé.

OutilsTuto
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour