Aller au contenu principal
InfrastructureAWS ML Blog3h· 2 min de lecture

Les applications d'IA à base d'agents sur AWS avec une stratégie moderne de maillage de données

Source originale ↗·

Amazon Web Services a publié un guide architectural détaillé pour construire des applications d'IA agentique sur un maillage de données distribué, en réponse aux lacunes de gouvernance que les systèmes actuels de type RAG (Retrieval Augmented Generation) ne permettent pas de combler. L'architecture proposée repose sur trois composants clés : Amazon S3 Vectors pour les bases de connaissances vectorielles, qui réduit les coûts de stockage et de requête jusqu'à 90 % par rapport aux bases de données vectorielles spécialisées dans des charges de travail à fréquence modérée ; Amazon S3 Tables avec support natif d'Apache Iceberg, qui offre jusqu'à dix fois plus de transactions par seconde que les tables Iceberg auto-gérées, avec sécurité au niveau des lignes, colonnes et cellules individuelles via AWS Lake Formation ; et enfin, une exposition du maillage de données sous forme d'outils MCP (Model Context Protocol) via AgentCore Gateway, avec des intercepteurs Lambda pour un contrôle d'accès déterministe à chaque invocation.

L'enjeu est considérable pour les entreprises qui déploient des agents IA en production. Contrairement aux pipelines RAG classiques, où l'agent se contente de récupérer des extraits d'un index vectoriel préexistant, les agents autonomes modernes découvrent dynamiquement des schémas de bases de données, construisent des requêtes SQL et synthétisent des données issues de sources multiples. Ce comportement expose des failles de gouvernance que le modèle à point de contrôle unique ne peut pas gérer : un agent de service client qui interroge simultanément des bases de commandes, des politiques de retour et des données clients peut contourner des restrictions d'accès si le contrôle n'est pas appliqué à chaque étape de la chaîne. L'architecture décrite impose des autorisations distinctes au niveau de la couche agent, de la passerelle, des outils et du maillage de données lui-même, sans point de défaillance unique.

Ce travail s'inscrit dans une évolution plus large de l'écosystème AWS vers l'IA agentique d'entreprise. Un article précédent d'AWS avait déjà abordé le contrôle d'accès fin pour les applications RAG sur des lacs de données serverless. La nouvelle architecture l'étend en intégrant Amazon Bedrock AgentCore Runtime, un environnement d'hébergement serverless qui déploie les agents dans des microVM isolés avec isolation de session, et le framework LangGraph pour orchestrer les appels aux outils MCP. Les intercepteurs de requêtes valident les jetons JWT et appliquent les périmètres d'autorisation, tandis que les intercepteurs de réponses gèrent la rédaction des données sensibles et la journalisation d'audit. AWS Bedrock Guardrails surveille en temps réel les injections de prompts et les contenus dangereux à chaque invocation d'outil. Cette architecture cible directement les équipes data et les architectes cloud qui doivent mettre en production des agents IA tout en respectant des contraintes de conformité et de sécurité strictes.

Impact France/UE

Les contrôles d'accès granulaires au niveau ligne/colonne/cellule et la journalisation d'audit intégrés facilitent la mise en conformité RGPD pour les entreprises européennes déployant des agents IA sur AWS.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

D&B a reconstruit sa base de 642 millions d'entreprises pour les agents IA
1VentureBeat AI 

D&B a reconstruit sa base de 642 millions d'entreprises pour les agents IA

Dun & Bradstreet, entreprise vieille de 180 ans spécialisée dans les données commerciales, vient d'annoncer une refonte complète de son infrastructure de données pour la rendre compatible avec les agents d'intelligence artificielle. Son "Commercial Graph" couvre 642 millions d'entreprises, soit presque le double des 300 millions de dossiers qu'il contenait il y a cinq ans, avec 11 000 champs par enregistrement et 100 milliards de vérifications qualité effectuées chaque mois. Cette base de données, utilisée par près de 200 000 clients dans le monde, analystes crédit, gestionnaires de risques, commerciaux, était conçue pour des humains capables d'attendre quelques secondes et d'interpréter des résultats ambigus. Quand les clients de D&B ont commencé à intégrer des agents IA dans leurs workflows de crédit, d'achats et de chaîne d'approvisionnement, l'architecture existante s'est révélée incompatible. Gary Kotovets, directeur des données et de l'analytique chez D&B, a expliqué à VentureBeat que l'entreprise devait désormais considérer les agents comme une nouvelle catégorie de consommateurs à part entière. Le problème fondamental est que les agents IA ne peuvent pas fonctionner avec des systèmes fragmentés, des latences élevées ou des relations statiques entre entités. Là où un analyste humain naviguait à travers plusieurs bases de données hétérogènes via des requêtes SQL, un agent a besoin d'une réponse en moins d'une seconde, d'une résolution d'entité vérifiée, et de relations dynamiques : si un PDG quitte une entreprise pour une autre, le dossier de risque doit suivre en temps réel ; si une filiale change de propriétaire, la hiérarchie complète doit se mettre à jour automatiquement. D&B a donc migré ses bases vers le cloud, redessiné son schéma de données, construit une couche de "data fabric" unifiant les enregistrements à l'échelle mondiale tout en respectant les contraintes réglementaires régionales, puis exposé l'ensemble via des outils MCP (Model Context Protocol) qui permettent aux agents d'interroger des données structurées avec leur contexte. Un moteur de résolution d'entités valide chaque requête pour garantir qu'une demande portant sur une entreprise renvoie bien vers un enregistrement unique et vérifié. L'entreprise a également créé un nouveau modèle d'authentification spécifique aux agents, distincts des utilisateurs humains. Ce chantier illustre une réalité que Kotovets dit avoir entendue de la bouche de centaines de directeurs des données et directeurs informatiques au cours des six derniers mois : les ambitions en matière d'IA se heurtent systématiquement à des fondations de données non standardisées et inexploitables par des machines. D&B, pourtant l'une des entreprises les mieux dotées en données commerciales structurées au monde, a quand même dû tout reconstruire. La montée en puissance des agents autonomes dans les processus métier critiques, évaluation du risque fournisseur, scoring crédit, due diligence, crée une pression inédite sur les fournisseurs de données pour qu'ils passent d'une logique de consultation humaine à une logique d'alimentation machine en temps réel. D&B se positionne ainsi en infrastructure de référence pour les agents d'entreprise, à un moment où MCP s'impose progressivement comme standard d'interopérabilité entre agents et sources de données.

UELes entreprises européennes clientes de D&B pour le risque crédit ou fournisseur peuvent désormais connecter leurs agents IA à cette base via MCP, dans le respect des contraintes réglementaires régionales incluant le RGPD.

💬 Si D&B, avec 180 ans de données commerciales structurées, a quand même dû tout reconstruire pour les agents IA, ton stack de données a peu de chances de s'en tirer sans casse. C'est le vrai enseignement de cet article, pas les 642 millions d'entreprises ou les 11 000 champs par dossier. Les agents ne tolèrent pas l'ambiguïté, pas la latence, pas les silos, et ça va forcer une vague de refonte data que beaucoup n'ont pas encore budgétisée.

InfrastructureActu
1 source
Les services financiers face aux exigences de données pour l'IA à base d'agents
2MIT Technology Review 

Les services financiers face aux exigences de données pour l'IA à base d'agents

Plus de la moitié des équipes de services financiers ont déjà déployé ou prévoient de déployer une IA agentique, selon Gartner. Ces systèmes, capables de planifier et d'exécuter des tâches de manière autonome plutôt que de simplement générer des réponses, suscitent un intérêt croissant dans le secteur bancaire et assurantiel. Mais selon Steve Mayzak, directeur général mondial du Search AI chez Elastic, leur succès dépend moins de la sophistication des algorithmes que de la qualité des données sous-jacentes. "Tout commence par les données", résume-t-il. Une étude Forrester révèle pourtant que 57 % des organisations financières sont encore en train de développer les capacités internes nécessaires pour exploiter pleinement ces technologies agentiques. L'enjeu est considérable : une IA agentique amplifie autant les forces que les failles de son infrastructure data. Dans un secteur aussi réglementé, les exigences vont bien au-delà de la simple performance. Les entreprises doivent pouvoir tracer et justifier chaque décision prise par le modèle, données d'entrée comprises. "Il ne suffit pas d'expliquer d'où viennent les données et ce qu'elles sont devenues. Il faut une manière auditable et gouvernable d'expliquer quelle information le modèle a retenue et pourquoi elle était pertinente pour l'étape suivante", insiste Mayzak. Les hallucinations, les réponses incohérentes et les décisions difficiles à retracer minent la confiance des régulateurs, des clients et des équipes internes. Pour les transactions, les signaux de risque, les politiques internes ou l'historique client, la donnée doit être indexée, centralisée et accessible, pas enfouie dans des silos séparés. Le défi est structurel autant que technique. Les données financières existent sous des formats hétérogènes, accumulés sur des décennies d'histoire bancaire, mélangeant données structurées (tableurs, bases transactionnelles) et non structurées (notes de conseillers, échanges clients, documents contractuels). Or le langage naturel est, par nature, bien plus ambigu que les données tabulaires, ce qui rend leur nettoyage et leur organisation particulièrement complexes. Mayzak illustre la difficulté : "Il existe de nombreuses façons de décrire comment exécuter un ordre de bourse dans une banque. Dans un monde piloté par des agents IA, ces descriptions doivent être déterministes, donner le même résultat à chaque fois. Pourtant, on construit sur des modèles puissants mais non déterministes. C'est incroyablement délicat, mais pas impossible." Les prochaines années verront les acteurs financiers investir massivement dans la gouvernance des données, condition sine qua non pour transformer l'IA agentique d'outil prometteur en avantage compétitif réel.

UELes banques et assureurs européens, soumis à l'AI Act et à DORA, doivent impérativement résoudre les défis de gouvernance et d'auditabilité des données pour déployer une IA agentique conforme aux exigences réglementaires.

💬 57% des organisations financières encore en train de "construire les capacités" pour l'IA agentique, c'est beaucoup de retard pour un secteur qui prétend se transformer. L'enjeu soulevé par Mayzak est le bon : tu peux avoir le meilleur modèle du monde, si tes données transactionnelles sont éparpillées en silos depuis 30 ans, l'agent va amplifier le chaos, pas le résoudre. Et la vraie tension, celle qu'on évite de nommer, c'est qu'on veut des résultats déterministes avec des modèles qui ne le sont pas.

InfrastructureOpinion
1 source
3AWS ML Blog 

Les surcouches à base d'agents pour moderniser les services d'entreprise existants

Les infrastructures d'entreprise reposent depuis des années sur des API REST et des microservices, des systèmes stables, bien rodés, mais conçus bien avant l'émergence des agents autonomes. Dans un article technique publié en collaboration entre des ingénieurs de Cisco et d'AWS, les auteurs présentent une approche baptisée "agentic overlays" : des couches d'enveloppe légères qui transforment des services REST existants en agents capables de participer au protocole A2A (Agent-to-Agent), le standard de communication inter-agents en train de s'imposer dans l'industrie. L'idée centrale est de ne rien réécrire : aucune duplication du code métier, aucune infrastructure parallèle à opérer, aucune migration forcée. Ces overlays exposent également les API REST comme outils compatibles avec le Model Context Protocol (MCP), permettant ainsi aux agents d'orchestration modernes de les invoquer directement. L'enjeu est considérable pour les entreprises qui ont déjà déployé des agents maison, souvent construits comme de simples endpoints REST avec de la logique agent embarquée. Ces agents ne sont pas nativement A2A : ils ne savent pas se découvrir mutuellement via des métadonnées (un "agent card"), négocier des capacités, ni échanger des messages structurés en JSON-RPC pour coordonner des tâches complexes. Sans solution de transition, les entreprises se retrouvent face à un choix coûteux : maintenir deux mondes en parallèle (l'ancien en REST, le nouveau en A2A) ou tout réécrire. Les overlays proposés permettent d'éviter ce dilemme en réduisant ce que les auteurs appellent l'"agent sprawl", la prolifération incontrôlée d'agents disparates dans l'infrastructure. Cette approche s'inscrit dans un contexte d'accélération rapide des standards d'interopérabilité entre agents. Le protocole A2A, porté notamment par Google, vise à établir un langage commun pour que des agents d'éditeurs différents puissent collaborer, déléguer des sous-tâches et composer des workflows multi-étapes, là où REST se contentait d'exécutions isolées et déterministes. L'adoption a jusqu'ici été freinée par la complexité opérationnelle d'introduire ces nouvelles infrastructures sans perturber les systèmes en production. En proposant des architectures de référence et du code d'exemple, les auteurs cherchent à abaisser cette barrière d'entrée et à accélérer la migration progressive des parcs applicatifs existants vers un monde d'agents interopérables, sans rupture brutale.

UELes entreprises européennes disposant de parcs applicatifs REST existants pourraient adopter ces patterns d'overlay pour migrer progressivement vers des architectures multi-agents sans réécriture coûteuse, mais aucun acteur ou réglementation européen n'est spécifiquement concerné.

InfrastructureOpinion
1 source
Oracle unifie sa pile de données IA pour offrir aux agents d'entreprise une source unique de vérité
4VentureBeat AI 

Oracle unifie sa pile de données IA pour offrir aux agents d'entreprise une source unique de vérité

Oracle a annoncé cette semaine un ensemble de nouvelles capacités pour sa plateforme Oracle AI Database, articulées autour d'un composant central baptisé Unified Memory Core. Ce moteur transactionnel unique traite simultanément des données vectorielles, JSON, graphes, relationnelles, spatiales et en colonnes — sans couche de synchronisation intermédiaire. L'annonce comprend également Vectors on Ice, un service d'indexation vectorielle native sur les tables Apache Iceberg, un service managé Autonomous AI Vector Database gratuit au démarrage, et un serveur MCP permettant aux agents externes d'accéder directement à la base de données sans code d'intégration personnalisé. Oracle, dont l'infrastructure de base de données équipe les systèmes transactionnels de 97 % des entreprises du Fortune Global 100 selon ses propres chiffres, positionne ces fonctionnalités comme une réponse architecturale directe aux problèmes rencontrés en production par les équipes déployant des agents IA. Le problème que cherche à résoudre Oracle est précis : les agents IA construits sur une combinaison de bases vectorielles, relationnelles, de graphes et de lakehouses nécessitent des pipelines de synchronisation pour maintenir leur contexte à jour — et sous charge de production, ce contexte devient obsolète. En centralisant tous les types de données dans un seul moteur ACID, Oracle élimine ce besoin de synchronisation et garantit une cohérence transactionnelle sur l'ensemble des formats. La fonctionnalité Vectors on Ice s'adresse spécifiquement aux équipes utilisant Apache Iceberg avec Databricks ou Snowflake : l'index vectoriel se met à jour automatiquement à mesure que les données sous-jacentes évoluent, permettant des requêtes combinant recherche vectorielle et données relationnelles ou graphes dans une seule opération. Le serveur MCP applique automatiquement les contrôles d'accès par ligne et par colonne d'Oracle, quelle que soit la requête émise par l'agent. Cette annonce s'inscrit dans un marché en pleine recomposition. Les bases vectorielles spécialisées comme Pinecone, Qdrant ou Weaviate ont émergé comme points d'entrée naturels pour les développeurs IA, mais Oracle fait le pari que ces outils ne constituent qu'une étape transitoire avant que les entreprises ne cherchent une infrastructure unifiée et cohérente pour aller en production. Maria Colgan, vice-présidente en charge des moteurs de données mission-critical chez Oracle, a reconnu ouvertement que toutes les données d'entreprise ne résident pas dans Oracle — une concession inhabituelle pour l'éditeur — mais argue que le Unified Memory Core offre un avantage structurel là où la fragmentation du stack devient un frein opérationnel. L'enjeu est de taille : convaincre les architectes data que le bon endroit pour faire tourner des agents IA en production n'est pas un assemblage de services spécialisés, mais le moteur de base de données lui-même.

UELes entreprises européennes déployant des agents IA avec des stacks fragmentés (Oracle + Databricks/Snowflake) peuvent réduire leur complexité opérationnelle en production, sans impact réglementaire direct sur la France ou l'UE.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic