Aller au contenu principal
Infrastructure partagée, locataires isolés : la mutualisation multi-tenant avec Amazon Bedrock AgentCore
OutilsAWS ML Blog3h· 2 min de lecture

Infrastructure partagée, locataires isolés : la mutualisation multi-tenant avec Amazon Bedrock AgentCore

Source originale ↗·

Amazon Web Services vient de publier un guide architectural détaillé pour la construction d'applications d'intelligence artificielle multi-locataires à l'aide d'Amazon Bedrock AgentCore. Le document, second volet d'une série consacrée à ce sujet, s'appuie sur un cas concret dans le domaine médical : une plateforme d'agents IA servant simultanément plusieurs cliniques et hôpitaux. L'architecture proposée repose sur un modèle dit "pool", où tous les clients partagent la même infrastructure sous-jacente, mais sont isolés les uns des autres par des mécanismes logiques : identifiants scopés, politiques d'accès et partitionnement des données. La hiérarchie est structurée en trois niveaux, Niveau de service, Locataire, Utilisateur, et l'isolation est appliquée à chaque couche, depuis les documents stockés en base de connaissances jusqu'au suivi des coûts.

Ce schéma répond à un défi concret pour les éditeurs de logiciels en mode SaaS : comment servir des clients aux besoins très différents sans multiplier les infrastructures dédiées ni exposer des données d'un client à un autre ? La solution présentée définit deux niveaux de service distincts. L'offre basique, destinée aux petites cliniques, utilise le modèle Mistral Ministral 3 8B Instruct pour des tâches de recherche documentaire simples, avec un coût réduit. L'offre premium, réservée aux hôpitaux et centres spécialisés, s'appuie sur OpenAI GPT OSS 120B, un modèle de 120 milliards de paramètres aux capacités de raisonnement avancées, et donne accès à des outils supplémentaires comme la recherche web. Cette différenciation par niveaux permet à un même fournisseur de servir des clients aux exigences très différentes tout en maintenant une efficacité opérationnelle.

Le contexte est celui d'une adoption croissante des agents IA dans les entreprises, qui soulève des questions de gouvernance, d'attribution des coûts et de qualité de service que les architectures classiques ne résolvent pas facilement. Amazon positionne Bedrock AgentCore comme une brique native pour absorber cette complexité sans code personnalisé excessif. La publication du dépôt GitHub associé aux exemples illustre une volonté de standardisation des pratiques : l'objectif est que les équipes techniques puissent répliquer ces patterns dans des secteurs variés, plateformes SaaS, solutions d'entreprise multi-entités, services managés. Les enjeux sont significatifs, car une mauvaise isolation entre locataires dans un contexte médical exposerait des données sensibles de patients, avec des conséquences réglementaires sévères. Ce cadre architectural cherche précisément à rendre ce risque gérable par conception plutôt que par surveillance manuelle.

Impact France/UE

Les éditeurs européens de SaaS dans le secteur médical peuvent s'appuyer sur ces patterns d'isolation multi-tenant pour faciliter la conformité au RGPD, même si la solution repose intégralement sur l'infrastructure américaine d'AWS.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Créer des agents multi-locataires avec Amazon Bedrock AgentCore
1AWS ML Blog 

Créer des agents multi-locataires avec Amazon Bedrock AgentCore

Amazon a lancé Bedrock AgentCore, un service managé et serverless conçu pour permettre aux éditeurs de logiciels SaaS de déployer des applications agentiques en environnement multi-tenant sur AWS. Le service offre des primitives pour héberger des agents et des serveurs MCP (Model Context Protocol), avec une gestion intégrée des identités, de la mémoire, de l'observabilité et des évaluations. Le coeur de son architecture repose sur des microVMs isolées par session: chaque session client obtient son propre environnement d'exécution éphémère, avec un système de fichiers persistant propre, sans le coût ni la latence d'une machine virtuelle complète. Le contexte du tenant transite via des en-têtes HTTP personnalisés, portant l'identifiant du tenant, son niveau de service, ses préférences régionales et ses droits d'accès aux outils, ce qui permet à l'agent d'adapter dynamiquement son comportement sans logique de routage codée en dur. Cette approche répond directement au fossé qui sépare un prototype fonctionnel d'un déploiement en production dans un contexte SaaS. Les architectes d'applications agentiques devaient jusqu'ici résoudre manuellement six problèmes distincts: l'isolation des tenants, la propagation de leur identité, l'observabilité par tenant, l'isolation des données, l'attribution des coûts et la mitigation du "noisy neighbor" (un tenant monopolisant les ressources au détriment des autres). AgentCore propose trois patterns d'isolation, appelés Silo, Pool et Bridge, chacun offrant un compromis différent entre protection stricte et mutualisation des coûts. Pour les éditeurs gérant des centaines ou des milliers de clients sur une même plateforme, cette capacité à choisir un modèle d'isolation par segment tarifaire change concrètement l'équation économique et de conformité. Le lancement s'inscrit dans une course des grands fournisseurs cloud à imposer leurs infrastructures agentiques comme standard de facto pour la prochaine génération d'applications IA. AWS fait face à la concurrence directe de Google avec Vertex AI Agent Builder et de Microsoft avec Azure AI Agent Service, tous trois cherchant à capter les équipes d'ingénierie qui passent de l'expérimentation à la production. L'article publié par AWS est le premier d'une série, ce qui suggère que d'autres composants d'AgentCore (évaluation, fine-tuning par tenant, facturation granulaire) seront détaillés dans les prochaines semaines. La question centrale pour les équipes SaaS reste le degré de lock-in accepté en échange de la simplicité opérationnelle qu'offre un service pleinement managé.

UELes éditeurs SaaS européens construisant sur AWS peuvent exploiter les patterns d'isolation et les préférences régionales d'AgentCore pour satisfaire les exigences de résidence des données imposées par le RGPD.

OutilsOpinion
1 source
Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory
2AWS ML Blog 

Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory

Amazon Web Services a présenté une solution pour doter Kiro CLI d'une mémoire conversationnelle persistante entre les sessions, en s'appuyant sur Amazon Bedrock AgentCore Memory. Kiro CLI est l'interface en ligne de commande qui permet aux développeurs d'interagir directement depuis leur terminal avec les agents IA de Kiro, l'IDE agentique d'AWS. Le problème résolu est concret : chaque nouvelle session repart de zéro, forçant le développeur à réexpliquer le contexte de son projet, ses préférences et ses conventions à chaque démarrage. La solution repose sur un serveur MCP (Model Context Protocol) personnalisé, open source et disponible sur GitHub, qui fait le pont entre Kiro CLI et le service managé Bedrock AgentCore Memory. Ce serveur expose trois catégories d'outils : des outils conversationnels pour stocker et retrouver l'historique par sujet ou période, des outils de supervision pour consulter les statistiques d'utilisation mémoire, et des outils d'administration pour supprimer des sessions ou des données ciblées. La récupération du contexte repose sur une stratégie à deux niveaux : une recherche sémantique via l'API retrievememoryrecords d'AgentCore Memory, avec repli automatique sur une correspondance directe dans les contenus bruts si le premier niveau n'a pas encore terminé son indexation. L'impact pour les équipes de développement travaillant sur des bases de code volumineuses est direct. Un développeur qui revient sur un projet après plusieurs jours n'a plus besoin de réexpliquer l'architecture, les contraintes métier ou ses préférences de style à l'agent IA : celui-ci retrouve automatiquement les sessions précédentes, identifiables par des formulations naturelles comme "hier soir" ou "la semaine dernière". Cette continuité de contexte réduit la friction cognitive et le temps perdu en répétition, deux freins majeurs à l'adoption productive des outils IA dans les workflows de développement au quotidien. Amazon Bedrock AgentCore Memory est un service entièrement managé lancé par AWS pour répondre à un besoin croissant dans l'écosystème des agents IA : la persistance de la mémoire à long terme. Jusqu'ici, les agents IA des IDEs et des outils de développement souffraient d'une amnésie structurelle entre les sessions, limitant leur utilité réelle sur des projets complexes et de longue durée. Le Model Context Protocol, standardisé par Anthropic, est devenu le mécanisme central d'extensibilité pour les agents IA, permettant à des services tiers d'exposer des capacités via une interface unifiée. AWS positionne ainsi AgentCore Memory comme une brique d'infrastructure réutilisable pour tout éditeur souhaitant ajouter de la mémoire à ses propres agents MCP-compatibles. La mise à disposition du code source en exemple sur GitHub signale une volonté d'adoption large, au-delà de Kiro, vers l'ensemble des clients AWS qui construisent des outils agentiques sur Bedrock.

OutilsOutil
1 source
Créer des agents d'automatisation de tableaux de bord propulsés par l'IA avec le NLP sur Amazon Bedrock AgentCore
3AWS ML Blog 

Créer des agents d'automatisation de tableaux de bord propulsés par l'IA avec le NLP sur Amazon Bedrock AgentCore

Amazon Web Services a dévoilé une solution d'automatisation de tableaux de bord basée sur l'intelligence artificielle, combinant trois de ses services : Amazon Bedrock AgentCore, le framework Strands Agents et Amazon QuickSight. L'architecture repose sur un système multi-agents composé de trois entités spécialisées : un agent de découverte (Find Dashboard Agent) chargé d'explorer les tableaux de bord et leurs métadonnées, un agent de modification (Modify Dashboard Agent) qui exécute les changements de configuration et crée de nouvelles versions, et un agent orchestrateur qui route les requêtes en langage naturel vers les agents appropriés. Concrètement, un analyste peut saisir une instruction comme "Ajoute le champ 'lastname' au tableau de bord testing" et le système interprète, valide et déploie la modification de façon autonome, tout en conservant une version originale pour permettre un retour arrière si nécessaire. L'enjeu est significatif pour les équipes métier : là où les processus traditionnels imposent plusieurs jours d'attente, soumission d'une demande à l'IT, interprétation des besoins, navigation dans la documentation d'API, déploiement, cette approche réduit le délai à quelques secondes. Le modèle de langage Amazon Nova assure la classification des requêtes entre interactions conversationnelles simples et opérations techniques réelles. Les modifications sont validées contre les colonnes disponibles dans les datasets avant exécution, ce qui maintient les contrôles de sécurité et génère des pistes d'audit. Pour les entreprises dont les décisions dépendent de données fraîches et de visualisations actualisées, supprimer ce goulot d'étranglement entre l'expression d'un besoin et sa concrétisation dans un dashboard représente un gain opérationnel direct. Cette solution s'inscrit dans la dynamique plus large d'AWS de rendre Amazon Bedrock AgentCore accessible comme plateforme d'hébergement d'agents en production, sans gestion d'infrastructure. La mémoire de session intégrée (AgentCore Memory) maintient le contexte des conversations, tandis que le module d'observabilité enregistre les décisions des agents et trace les appels API, deux composantes critiques pour déployer des agents autonomes dans des environnements d'entreprise régulés. Le framework Strands Agents, orienté code-first avec intégration native aux services AWS, positionne AWS face à des concurrents comme LangChain ou AutoGen sur le terrain des orchestrateurs d'agents. La prochaine étape logique pour ce type de système serait d'étendre la couverture au-delà de QuickSight vers d'autres services de données, voire de permettre aux agents de proposer eux-mêmes des modifications pertinentes en détectant des anomalies dans les métriques surveillées.

UELes équipes analytiques européennes utilisant des services de BI cloud pourraient réduire leurs délais de modification de tableaux de bord de plusieurs jours à quelques secondes, sans impact réglementaire direct sur la France ou l'UE.

OutilsOutil
1 source
Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés
4AWS ML Blog 

Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés

Amazon a annoncé en avant-première AgentCore Payments, une nouvelle fonctionnalité d'Amazon Bedrock développée en partenariat avec Coinbase Developer Platform et Stripe (via Privy), qui permet aux agents d'intelligence artificielle d'effectuer des transactions financières au nom de leurs utilisateurs. Disponible en préversion dans quatre régions, Virginie du Nord, Oregon, Francfort et Sydney, la solution repose sur un système de portefeuilles embarqués auto-custodiaux hébergés chez ces partenaires. Concrètement, chaque session de paiement est isolée, assortie d'un budget configurable et d'une durée de vie limitée (TTL), empêchant tout agent de dépenser librement au-delà du périmètre défini. Les informations sensibles, numéros de carte, codes CVV, clés d'API développeur, ne transitent jamais dans le contexte de l'agent, ce qui réduit considérablement la surface d'exposition en cas de compromission. Cette capacité répond à un verrou majeur dans le déploiement des agents autonomes : jusqu'ici, dès qu'une ressource web, un outil ou un endpoint MCP nécessitait un paiement, l'agent se retrouvait bloqué, incapable de finaliser la tâche sans intervention humaine. En intégrant la transaction directement dans l'infrastructure AWS, Amazon permet aux développeurs de construire des agents capables de mener à bien des missions complexes sans interruption. Les garde-fous sont conçus pour répondre aux trois risques principaux identifiés : les dépenses incontrôlées liées au comportement non-déterministe des grands modèles de langage, l'absence de délégation explicite de la part de l'utilisateur final, et la compromission des credentials développeur ou des tokens de portefeuille. Les limites de dépense sont appliquées au niveau de l'infrastructure, en dehors du modèle, ce qui les rend incontournables même si l'agent est manipulé ou mal configuré. Cette annonce s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à industrialiser l'infrastructure nécessaire aux agents autonomes, au-delà des simples appels d'API. AWS positionne Bedrock AgentCore comme une couche de confiance entre les agents et les systèmes financiers réels, à un moment où la course à l'agentivité s'intensifie entre Amazon, Google et Microsoft. Le choix de Coinbase et Stripe comme partenaires n'est pas anodin : il permet de couvrir à la fois les paiements en crypto-monnaie et les paiements en monnaie fiduciaire, deux rails complémentaires selon les cas d'usage. La fonctionnalité reste en préversion, avec des API susceptibles d'évoluer avant la disponibilité générale, mais elle marque une étape concrète vers des agents capables d'agir pleinement en mandataires économiques de leurs utilisateurs, avec un cadre de responsabilité clairement défini.

UELa région Frankfurt est incluse dans les quatre régions de préversion, ouvrant l'accès aux développeurs européens, mais sans cadre réglementaire spécifique à l'UE mentionné pour encadrer les paiements délégués à des agents IA.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic