Aller au contenu principal
SécuritéAWS ML Blog5h· 2 min de lecture

Amazon Bedrock Guardrails : protégez vos applications IA à base d'agents avec l'API InvokeGuardrailChecks

Source originale ↗·

Amazon Web Services a annoncé une nouvelle interface de programmation pour son service Amazon Bedrock Guardrails : l'API InvokeGuardrailChecks. Disponible dès à présent, elle permet aux développeurs d'appliquer des contrôles de sécurité individuels à n'importe quel point d'une application d'IA agentique, sans avoir à créer et gérer des ressources de guardrail dédiées en amont. Concrètement, l'API fonctionne en mode détection seule et retourne des scores numériques pour chaque vérification effectuée. Les équipes peuvent ensuite définir leurs propres seuils et décider de bloquer, contourner, relancer ou journaliser les résultats selon leurs besoins spécifiques.

Cette annonce répond à un problème concret posé par les agents IA modernes, qui fonctionnent en boucles multi-tours plutôt qu'en simples échanges question-réponse. Une session utilisateur peut enchaîner dix, vingt interactions ou davantage, chacune présentant un profil de risque distinct : injection de prompt à l'entrée, contenu nuisible dans la réponse du modèle, données personnelles exposées dans un message de suivi. Jusqu'ici, sécuriser chaque étape de cette boucle supposait de provisionner des ressources de guardrail séparées pour chaque étape, une complexité opérationnelle qui devient ingérable à mesure qu'une organisation déploie des centaines d'agents. L'API InvokeGuardrailChecks supprime cette friction en offrant un contrôle granulaire, requête par requête, sur les vérifications à activer à chaque tour de boucle, sans identifiant de guardrail à suivre ni version à maintenir.

Amazon Bedrock Guardrails existe depuis que l'entreprise a cherché à doter sa plateforme de services IA managés de mécanismes de filtrage du contenu, pour protéger aussi bien les entrées utilisateurs que les sorties des modèles fondamentaux. L'essor des architectures agentiques, où des modèles comme ceux d'Anthropic, Meta ou Mistral orchestrent des outils et prennent des décisions en autonomie, a rendu les approches de sécurité monolithiques insuffisantes. Le nouveau schéma de messages structuré, qui attribue un rôle explicite (système, utilisateur, assistant) à chaque bloc de contenu, permet aux vérifications de prendre en compte le contexte précis de chaque interaction dans la boucle. La prochaine étape pour AWS sera vraisemblablement d'étendre la liste des vérifications supportées et d'intégrer l'API plus étroitement avec les frameworks d'orchestration d'agents comme LangChain ou Amazon Bedrock Agents, alors que la sécurité des systèmes autonomes s'impose comme l'un des défis centraux de l'industrie pour 2026.

Impact France/UE

Les développeurs européens utilisant Amazon Bedrock peuvent intégrer dès maintenant ces contrôles de sécurité granulaires dans leurs agents IA, ce qui facilite la conformité aux exigences de supervision humaine et de gestion des risques imposées par l'AI Act.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS
1AWS ML Blog 

Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS

Amazon a lancé AgentCore Identity, un service intégré à Amazon Bedrock, conçu pour sécuriser l'accès des agents d'intelligence artificielle aux services externes. Disponible en tant que service autonome, il s'intègre aux principales plateformes de calcul d'AWS, Amazon ECS, Amazon EKS, AWS Lambda, ainsi qu'aux environnements on-premises. La solution s'appuie sur deux protocoles standards : OAuth 2.0 (RFC 6749) pour l'autorisation des actions, et OpenID Connect (OIDC) pour l'authentification des utilisateurs. Le flux retenu est l'Authorization Code Grant, dit « 3-legged OAuth » : l'utilisateur s'authentifie auprès d'un fournisseur d'identité comme Microsoft Entra ID, donne son consentement explicite, et l'application échange un code d'autorisation contre un jeton d'accès à portée limitée. Ce jeton est ensuite conservé dans le coffre-fort de tokens d'AgentCore Identity, lié à l'identité précise de l'utilisateur, créant ainsi une chaîne d'audit traçable de l'authentification jusqu'à l'action de l'agent. Ce mécanisme répond à un problème concret et croissant en production : comment empêcher un agent IA d'agir au-delà de ce que l'utilisateur a expressément autorisé. AgentCore Identity introduit un « session binding » applicatif qui protège contre les attaques CSRF et les attaques par substitution de navigateur, deux vecteurs courants dans les flux OAuth mal implémentés. Chaque token est scopé à une session utilisateur individuelle, suivant le principe du moindre privilège : l'agent ne peut accéder qu'aux ressources pour lesquelles le consentement a été donné. La séparation des responsabilités entre le workload agent et le service de session binding permet en outre de réduire la surface d'attaque et de centraliser la gestion du cycle de vie des tokens, sans que l'application principale n'ait à gérer ce risque directement. La mise en production de cette architecture illustre une tendance de fond dans l'industrie cloud : les agents IA autonomes ne peuvent plus fonctionner sur la base de credentials statiques ou de permissions trop larges. AWS propose ici une implémentation de référence déployée sur Amazon ECS derrière un Application Load Balancer, avec chiffrement HTTPS via AWS Certificate Manager et routage DNS via Amazon Route 53. Le code source complet est disponible sur GitHub. Pour les équipes qui construisent des agents agissant pour le compte d'utilisateurs réels, assistants, automatisations, workflows délégués, cette approche standardisée autour d'OIDC et OAuth 2.0 constitue désormais une baseline de sécurité incontournable, d'autant qu'elle s'appuie sur des fournisseurs d'identité existants plutôt que de réinventer une gestion des identités propriétaire.

UELes équipes européennes déployant des agents IA sur AWS disposent d'une baseline de sécurité standardisée qui facilite la conformité RGPD grâce au consentement explicite, à la traçabilité des accès et au principe du moindre privilège.

SécuritéOutil
1 source
Amazon utilise des agents IA pour la détection de vulnérabilités à grande échelle
2Amazon Science 

Amazon utilise des agents IA pour la détection de vulnérabilités à grande échelle

En 2025, la base de données nationale des vulnérabilités américaine (NVD) a enregistré plus de 48 000 nouvelles failles de sécurité référencées (CVE), un volume rendu possible en grande partie par la prolifération des outils automatisés de détection. Face à cette explosion, Amazon Web Services a développé RuleForge, un système d'intelligence artificielle agentique conçu pour générer automatiquement des règles de détection à partir d'exemples de code d'exploitation de vulnérabilités. Déployé en production chez AWS, RuleForge affiche une productivité supérieure de 336 % à la création manuelle, tout en conservant le niveau de précision exigé pour des systèmes de sécurité industriels. Les règles produites sont au format JSON et alimentent directement MadPot, le système mondial de "honeypot" d'Amazon qui capture le comportement des attaquants, ainsi que Sonaris, le moteur interne de détection d'exploits suspects. Avant RuleForge, transformer une CVE en règle de détection opérationnelle était un processus entièrement manuel : un analyste téléchargeait le code de preuve de concept, étudiait le mécanisme d'attaque, rédigeait la logique de détection, la validait par itérations successives contre les journaux de trafic, puis soumettait le tout à une revue par un second ingénieur avant déploiement. Ce cycle, rigoureux mais lent, obligeait les équipes à prioriser strictement les vulnérabilités traitées, laissant potentiellement des failles critiques sans couverture. RuleForge comprime ce délai de façon drastique : le système ingère automatiquement le code d'exploitation public, attribue un score de priorité via une analyse de contenu croisée avec des sources de threat intelligence, puis génère en parallèle plusieurs règles candidates via un agent tournant sur AWS Fargate avec Amazon Bedrock. Chaque candidate est évaluée non pas par le modèle qui l'a produite, mais par un agent "juge" distinct, évitant ainsi l'auto-validation biaisée. Les humains restent dans la boucle pour l'approbation finale avant mise en production. Cette architecture reflète une tendance profonde dans la sécurité offensive et défensive : l'automatisation par IA ne remplace pas les experts, elle leur permet de travailler à une échelle autrement inaccessible. AWS anticipe une croissance continue du nombre de CVE à haute sévérité publiées, portée par les mêmes outils d'IA qui accélèrent la découverte de failles côté attaquants. RuleForge représente la réponse symétrique côté défense, en industrialisant la réactivité. L'approche modulaire, avec des agents spécialisés pour la génération, l'évaluation et le raffinement, plutôt qu'un seul modèle monolithique, s'inscrit dans la lignée des architectures multi-agents qui émergent comme standard pour les tâches complexes nécessitant fiabilité et auditabilité. D'autres grands acteurs du cloud font face aux mêmes défis, et la publication par Amazon des détails de RuleForge suggère une volonté de positionner cette approche comme référence sectorielle.

SécuritéActu
1 source
Des applications de surveillance cherchent à empêcher les agents IA de dériver
3The Information AI 

Des applications de surveillance cherchent à empêcher les agents IA de dériver

Face aux dérives des agents IA autonomes — qui ont déjà causé des incidents de sécurité et des pannes chez Meta et Amazon — de grandes entreprises comme ServiceNow, ainsi que plusieurs startups, développent une nouvelle catégorie de logiciels baptisés "agents IA gardiens". Ces outils de surveillance prennent la forme d'applications cloud conçues pour détecter et stopper les comportements erratiques ou dangereux d'autres agents IA avant qu'ils ne causent des dommages. Concrètement, ces agents gardiens se connectent aux agents IA déjà déployés en entreprise — qu'ils soient construits avec OpenClaw, Claude Code ou Salesforce Agentforce — via des interfaces de programmation standard ou des serveurs MCP (Model Context Protocol). Une fois en place, ils surveillent en temps réel les actions des agents supervisés et peuvent intervenir si ceux-ci s'écartent de leur mission. La mise en place reste cependant fastidieuse : chaque connexion doit être configurée manuellement, ce qui freine l'adoption à grande échelle. L'émergence de ces outils reflète une tension croissante dans l'industrie : les entreprises déploient des agents IA de plus en plus autonomes pour automatiser des tâches complexes, mais peinent à en contrôler les effets de bord. Les incidents chez des acteurs aussi matures que Meta et Amazon illustrent que même les équipes les plus aguerries ne sont pas à l'abri. La question du contrôle et de la gouvernance des agents IA autonomes s'impose désormais comme un enjeu stratégique central pour 2026, ouvrant un marché potentiellement lucratif pour les acteurs qui sauront proposer des solutions fiables et simples à déployer.

UELes entreprises européennes déployant des agents IA autonomes sont directement concernées par ces enjeux de gouvernance, d'autant que l'AI Act impose des exigences de contrôle et de traçabilité sur les systèmes IA à haut risque.

💬 Des agents pour surveiller les agents, on y est. C'est un peu absurde sur le papier, mais quand Meta et Amazon ont des incidents en prod avec leurs propres systèmes, tu te dis que le problème est réel et pas juste théorique. La vraie limite pour l'instant c'est l'intégration manuelle, un agent gardien qui demande autant de config que l'agent qu'il surveille, ça va freiner tout le monde.

SécuritéOpinion
1 source
4VentureBeat AI 

NanoClaw et Vercel simplifient les règles et validations pour agents IA dans 15 applications de messagerie

NanoCo, la startup privée issue du projet open source NanoClaw, a annoncé le 17 avril 2026 un partenariat stratégique avec Vercel et OneCLI pour lancer NanoClaw 2.0, un système de contrôle humain intégré directement dans l'infrastructure des agents IA autonomes. Concrètement, ce système intercepte toute action sensible d'un agent, modification d'infrastructure cloud, envoi d'email, virement bancaire, et envoie une demande d'approbation interactive à l'utilisateur sur l'une des 15 applications de messagerie supportées : Slack, WhatsApp, Telegram, Microsoft Teams, Discord, Google Chat, iMessage, Messenger, Instagram, X, GitHub, Linear, Matrix, Email et Webex. L'utilisateur reçoit une carte native dans son application habituelle et approuve ou refuse en un seul tap. Ce mécanisme repose sur la combinaison du Chat SDK de Vercel, qui unifie le déploiement sur toutes ces plateformes depuis une seule base de code TypeScript, et du Rust Gateway d'OneCLI, qui intercepte les requêtes sortantes avant qu'elles n'atteignent le service cible. L'enjeu central de cette annonce est la résolution d'un problème de sécurité fondamental qui bloquait l'adoption enterprise des agents IA : jusqu'ici, utiliser un agent vraiment utile obligeait à lui confier des clés API réelles et des permissions larges, exposant les systèmes à des erreurs catastrophiques par hallucination ou compromission. NanoClaw 2.0 bascule d'une sécurité "au niveau applicatif", où c'est l'agent lui-même qui demande la permission, et pourrait donc manipuler l'interface, à une sécurité "au niveau infrastructure", totalement indépendante du modèle. Gavriel Cohen, cofondateur de NanoCo et ancien ingénieur chez Wix.com, résume le risque précédent ainsi : un agent malveillant ou compromis pourrait inverser les boutons "Approuver" et "Refuser" dans sa propre interface de validation. Avec le nouveau système, l'agent ne voit jamais les vraies clés API ; il manipule uniquement des clés fictives ("placeholder"), et le gateway Rust injecte les credentials réels chiffrés uniquement après approbation humaine explicite. NanoClaw avait été lancé le 31 janvier 2026 comme réponse minimaliste aux frameworks d'agents jugés trop complexes et intrinsèquement non sécurisés, notamment par leur absence de sandboxing. Les agents tournent dans des conteneurs Docker ou Apple Container strictement isolés, ce qui constitue le socle technique de toute la chaîne de contrôle. Ce partenariat avec Vercel et OneCLI représente la première tentative d'établir un standard d'infrastructure partagé pour la gouvernance des agents autonomes en entreprise, un marché encore largement non normalisé. Les cas d'usage prioritaires visés sont les équipes DevOps, qui pourraient valider des changements d'infrastructure via Slack, et les équipes finance, qui pourraient approuver des paiements batch via WhatsApp. La prochaine étape logique sera de savoir si d'autres frameworks d'agents, LangChain, AutoGen, CrewAI, adopteront des mécanismes similaires, ou si NanoClaw parviendra à s'imposer comme référence de facto pour la supervision humaine dans les pipelines agentiques d'entreprise.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic