Aller au contenu principal
Construction d'un serveur MCP sécurisé sur AWS pour une plateforme B2B d'un million d'entreprises
OutilsInfoQ AI6sem· 1 min de lecture

Construction d'un serveur MCP sécurisé sur AWS pour une plateforme B2B d'un million d'entreprises

Source originale ↗·

Shadi Elyafi, ingénieur logiciel, a publié un retour d'expérience détaillé sur la construction d'un serveur MCP (Model Context Protocol) sécurisé sur AWS, destiné à exposer une plateforme d'intelligence B2B à un client LLM. La plateforme en question agrège les profils de plus d'un million d'entreprises, et l'objectif était de permettre à un utilisateur de formuler des requêtes en langage naturel du type « trouve des entreprises SaaS en Allemagne avec 50 à 200 employés » et d'obtenir des résultats directement dans son interface LLM, sans passer par une API classique.

L'enjeu central de ce projet n'était pas fonctionnel mais sécuritaire : comment ouvrir un accès LLM à des données de production sensibles sans créer une passerelle dangereuse ? Un modèle de langage branché directement sur une base de données réelle peut, en théorie, être manipulé pour extraire des données non autorisées, contourner des filtres, ou générer des requêtes destructrices. La conception du serveur MCP devait donc intégrer des garde-fous robustes, une gestion fine des autorisations et une isolation claire entre la logique d'inférence et les données métier.

Ce type d'architecture reflète une tendance croissante dans l'industrie : intégrer les outils MCP dans des environnements cloud d'entreprise pour donner aux LLM un accès structuré à des systèmes internes. Anthropic a défini le protocole MCP en fin 2024, et son adoption en contexte B2B s'accélère depuis. Les plateformes de données d'entreprise sont particulièrement concernées, car elles concentrent des informations concurrentielles à haute valeur, ce qui rend la question de la sécurisation de ces ponts LLM-production critique pour toute organisation qui souhaite tirer parti de l'IA générative en production.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026
1MarkTechPost 

Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026

Le Model Context Protocol (MCP), lancé par Anthropic en novembre 2024, s'est imposé en moins d'un an comme le standard de facto de l'écosystème agentique. OpenAI l'a adopté en mars 2025, Microsoft a annoncé son support dans Copilot Studio le même mois, et fin 2025 les téléchargements cumulés des SDK Python et TypeScript dépassaient 97 millions par mois. En décembre 2025, Anthropic a cédé le protocole à l'Agentic AI Foundation, hébergée par la Linux Foundation, pour en faire un bien commun de l'industrie. Gartner projette que 40 % des applications d'entreprise intégreront des agents IA spécialisés d'ici fin 2026, contre moins de 5 % aujourd'hui. Cette explosion soulève un problème central resté sans solution robuste : l'authentification. Quand un agent IA se contente de répondre à des questions, la sécurité d'accès reste anecdotique. Quand il lit des e-mails, met à jour des CRM, écrit dans des bases de données et appelle des API externes de façon autonome, l'authentification devient une infrastructure critique, et le coût d'une faille peut être considérable. La spécification MCP pour les déploiements HTTP protégés est précise : OAuth 2.1 avec PKCE est obligatoire, tous les endpoints doivent fonctionner en HTTPS, les métadonnées du serveur d'autorisation doivent être découvrables par les clients, et les mécanismes Protected Resource Metadata (RFC 9728) ainsi que Resource Indicators (RFC 8707) doivent être implémentés pour éviter la confusion d'audience des tokens. Plusieurs fournisseurs connus ne répondent pas encore à toutes ces exigences. C'est dans ce contexte que deux plateformes se distinguent : WorkOS, ciblant les équipes d'ingénierie enterprise, combine OAuth 2.1 compatible MCP avec SSO, SCIM, journaux d'audit et une autorisation granulaire (Fine-Grained Authorization) permettant de restreindre un agent à des outils précis plutôt qu'à un service entier. Stytch, filiale de Twilio, s'adresse aux équipes SaaS B2B déployant sur Cloudflare Workers et souhaitant ajouter l'authentification MCP sans migrer toute leur stack existante. L'enjeu dépasse le simple choix d'une bibliothèque. L'émergence des agents autonomes redéfinit la granularité des droits d'accès : il ne s'agit plus de savoir si un utilisateur peut accéder à une application, mais si un agent peut appeler un outil spécifique dans un service donné, dans un contexte précis, avec une traçabilité complète. Les acteurs comme Okta, Microsoft Entra ou des annuaires internes restent en jeu, mais les nouvelles plateformes comme WorkOS visent à s'y connecter plutôt qu'à les remplacer. Avec 40 % des applications enterprise concernées d'ici dix-huit mois, la fenêtre pour standardiser ces pratiques est courte, et les choix d'architecture faits aujourd'hui conditionneront la sécurité des systèmes agentiques pour les années à venir.

UELes entreprises européennes déployant des agents IA autonomes devront adopter ces standards d'authentification pour satisfaire aux exigences de traçabilité et d'auditabilité imposées par l'AI Act.

💬 L'auth pour agents, c'était le truc qu'on remettait à plus tard tant que les agents répondaient juste à des questions. Là, avec des systèmes qui lisent des mails, poussent dans des CRM et appellent des API externes sans supervision, c'est de l'infrastructure critique, et WorkOS a bien vu que le vrai sujet c'est l'autorisation à l'outil (pas à l'application, à l'outil spécifique). Reste à voir si les équipes qui déploient aujourd'hui vont s'y plier avant le premier incident sérieux.

OutilsOpinion
1 source
Construire une solution d'observabilité d'entreprise pour Amazon QuickSight
2AWS ML Blog 

Construire une solution d'observabilité d'entreprise pour Amazon QuickSight

Amazon Web Services propose une architecture de référence pour centraliser l'observabilité d'Amazon Q, sa plateforme d'IA générative d'entreprise. La solution, publiée par AWS, agrège les données opérationnelles issues de deux sources principales : les journaux CloudWatch Vended Logs, qui capturent les conversations, les retours utilisateurs, la consommation des agents et le stockage d'index, ainsi que les événements AWS CloudTrail, qui enregistrent toutes les actions effectuées par les utilisateurs et les services sur la plateforme. Ces données transitent via des filtres d'abonnement CloudWatch vers des flux Amazon Data Firehose, sont transformées par des fonctions AWS Lambda, puis stockées dans un data lake sécurisé sur Amazon S3. Le tout est chiffré au repos via une clé AWS KMS gérée par le client avec rotation automatique. Les équipes d'administration peuvent ensuite interroger ce lac de données avec Amazon Athena, visualiser les métriques dans un tableau de bord QuickSight, ou poser des questions en langage naturel à un agent conversationnel Amazon Q personnalisé. Le déploiement s'appuie sur AWS CDK et requiert Python 3.9 minimum, Node.js 20 et AWS CLI V2. Pour les organisations qui déploient Amazon Q à grande échelle, cette solution répond à un besoin concret : obtenir une vue unifiée de l'adoption, de la satisfaction des utilisateurs, des coûts et de la gouvernance depuis un seul tableau de bord. Sans cela, les données sont éparpillées entre plusieurs services AWS et deviennent rapidement inexploitables à l'échelle de centaines ou milliers d'utilisateurs. La protection des données sensibles est intégrée dès la collecte via des politiques de masquage dans CloudWatch, capables de détecter et anonymiser automatiquement des clés privées, informations financières, données personnelles ou de santé. AWS Lake Formation apporte en complément un contrôle fin des accès au niveau des tables et des colonnes. Amazon Q s'est imposé comme la réponse d'AWS au déploiement d'IA générative en entreprise, en intégrant dans un seul produit des espaces collaboratifs, des agents conversationnels, des flux automatisés, des outils de recherche et des capacités de business intelligence via QuickSight. Mais la croissance de ces déploiements a mis en évidence un angle mort : l'absence d'outil natif pour piloter l'usage à l'échelle. Cette architecture d'observabilité comble ce manque en s'appuyant entièrement sur des services AWS managés, sans infrastructure supplémentaire à maintenir. Elle s'inscrit dans une tendance plus large où les plateformes d'IA d'entreprise doivent désormais justifier leur ROI avec des métriques d'usage précises, répondre aux exigences d'audit réglementaire, et permettre aux directions métier de piloter les investissements IA en temps réel.

OutilsActu
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
3MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source
Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026
4MarkTechPost 

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026

En 2026, l'IA agentique d'entreprise a franchi le cap du projet pilote pour entrer dans les déploiements en production. Salesforce a conclu 29 000 contrats Agentforce depuis son lancement, générant 800 millions de dollars de revenus annuels récurrents. Microsoft Copilot Studio compte plus de 160 000 organisations qui font tourner plus de 400 000 agents personnalisés. ServiceNow a reconfiguré l'ensemble de son modèle commercial autour de niveaux d'autonomie IA. Sur le plan tarifaire, les modèles divergent : Agentforce facture 2 dollars par conversation ou 500 dollars pour 100 000 crédits Flex, tandis que Copilot Studio propose 200 dollars pour 25 000 crédits mensuels. Salesforce a par ailleurs finalisé en novembre 2025 l'acquisition d'Informatica pour renforcer la qualité des données intégrées à sa couche Data 360. Ces chiffres traduisent un basculement structurel : la question n'est plus de savoir s'il faut déployer des agents IA, mais quel outil convient à quel flux de travail. Ce mouvement massif vers la production révèle aussi ses limites. Les équipes qui ont réussi la transition des pilotes vers le déploiement réel rapportent que les échecs ne viennent pas des capacités des modèles, mais de trois problèmes récurrents : des données de mauvaise qualité, une propriété floue des cas limites, et une gouvernance jamais construite. Une pratique trompeuse s'est également généralisée dans le secteur, que les praticiens appellent l'« agent washing » : des éditeurs rebaptisent des chatbots existants, des scripts d'automatisation robotique ou des outils de workflow linéaires en les présentant comme des agents autonomes. Or, un vrai agent doit être capable de prise de décision autonome, de raisonnement multi-étapes et de gestion dynamique des erreurs, une barre que la majorité des produits commercialisés aujourd'hui ne franchit pas réellement. Les brochures marketing ne suffisent pas ; il faut tester sur des flux réels qui exigent ramifications, usage d'outils, rétention de contexte et récupération sur erreur. Les deux plateformes dominantes en volume illustrent une logique d'écosystème fermé. Agentforce s'appuie sur le moteur de raisonnement Atlas, qui décompose les tâches en étapes via une boucle Reason-Act-Observe, et reste nativement intégré aux données Salesforce, un avantage décisif pour les entreprises dont Salesforce est le système d'enregistrement central, mais une contrainte réelle pour les environnements SAP ou multi-stack. Copilot Studio bénéficie quant à lui d'une surface d'intégration massive : Teams, SharePoint, Dynamics 365 et le Microsoft Graph couvrent environ un milliard de sièges Microsoft 365 dans le monde. La stratégie gagnante pour 2026, selon les retours terrain, consiste à déployer un seul agent sur un workflow précis et bien documenté, mesurer les résultats, puis étendre progressivement, plutôt que de chercher une transformation générale en une seule vague.

UELes entreprises européennes sous écosystème Salesforce ou Microsoft 365 sont directement concernées par les nouvelles grilles tarifaires et les stratégies de déploiement d'agents autonomes décrites dans cet article.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic