Aller au contenu principal
L'autorisation des agents est défaillante, et la transmission de l'authentification aggrave le problème
SécuritéVentureBeat AI6sem· 2 min de lecture

L'autorisation des agents est défaillante, et la transmission de l'authentification aggrave le problème

Source originale ↗·

Anthony Grieco, vice-président senior et directeur de la sécurité de Cisco, l'a affirmé sans détour lors de la conférence RSAC 2026 : les incidents impliquant des agents IA non autorisés touchent régulièrement les clients de l'entreprise. Le problème qu'il décrit suit un schéma précis et récurrent, l'authentification réussit, l'identité de l'agent est confirmée, et pourtant l'agent accède à des données auxquelles il n'avait pas le droit de toucher, ou exécute des actions que personne n'avait autorisées à ce niveau de granularité. Ce n'est pas un problème d'identité, c'est un problème d'autorisation. Le rapport "State of AI Security 2026" de Cisco illustre l'ampleur du défi : 83 % des organisations prévoient de déployer des capacités agentiques, mais seulement 29 % se sentent prêtes à les sécuriser. À RSAC 2026, cinq éditeurs ont présenté des cadres d'identité pour agents, dont Cisco avec son Duo IAM et ses contrôles MCP gateway. Aucun ne comble l'ensemble des lacunes identifiées.

Le problème central est structurel. Comme l'a formulé Grieco : "Cet agent est un agent financier, mais même en tant qu'agent financier, il ne devrait pas accéder à toutes les données financières, seulement aux notes de frais d'une période précise." Kayne McGladrey, membre senior de l'IEEE, a confirmé que les organisations reproduisent par défaut les profils de droits des utilisateurs humains pour leurs agents, ce qui génère une inflation des permissions dès le premier jour. Carter Rees, VP de l'IA chez Reputation, a identifié la cause structurelle : le plan d'autorisation plat d'un LLM ne respecte pas les permissions par utilisateur. L'agent n'a pas besoin d'escalader ses privilèges, il les possède déjà. À cela s'ajoute un problème de visibilité : selon Elia Zaitsev, directeur technique de CrowdStrike, dans la plupart des configurations de journalisation par défaut, l'activité d'un agent est indiscernable de celle d'un humain, rendant toute détection d'anomalie très difficile.

Ce constat dépasse largement les observations d'un seul éditeur. Trois organismes de standardisation indépendants ont convergé vers le même diagnostic début 2026. Le NIST a publié en février un document appelant explicitement à des projets pilotes sur l'application des standards d'identité aux agents autonomes. L'OWASP a publié en décembre 2025 son "Top 10 for Agentic Applications", identifiant l'abus d'outils par sur-provisionnement de droits et la délégation non sécurisée comme des risques de premier rang. La Cloud Security Alliance a également lancé des travaux sur le sujet. Avec des entreprises qui envisagent jusqu'à 500 agents par employé selon Grieco, la question de l'autorisation granulaire, savoir précisément ce qu'un agent peut faire, sur quelles données, à quel moment, est en passe de devenir l'un des défis sécuritaires les plus urgents de l'entreprise moderne.

Impact France/UE

Les organisations européennes déployant des agents IA sont exposées aux mêmes défaillances d'autorisation, et les exigences de l'AI Act en matière de gestion des risques pour les systèmes à haut risque renforceront la pression réglementaire sur ce problème structurel.

💬 L'analyse de Mathieu

L'authentification, ça va. C'est l'autorisation le problème : les équipes copient par défaut les droits des humains sur leurs agents, chaque agent se retrouve sur-provisionné dès le départ, et dans les logs son activité est indiscernable d'un humain, donc tu détectes rien. 83 % des orgs veulent déployer des agents agentiques, 29 % se sentent prêtes à les sécuriser, et ça va piquer.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L'injection de prompts exploite les failles de conception des IA d'entreprise : agents, pipelines RAG et routeurs de modèles ciblés
1VentureBeat AI 

L'injection de prompts exploite les failles de conception des IA d'entreprise : agents, pipelines RAG et routeurs de modèles ciblés

L'injection de prompts s'est imposée comme la menace la plus critique pesant sur les systèmes d'intelligence artificielle en entreprise, selon plusieurs rapports convergents publiés entre 2025 et 2026. L'OWASP LLM Top 10 (édition 2025) la classe en première position pour la deuxième édition consécutive, reconnaissant l'incapacité persistante des grands modèles de langage à distinguer fiablement les instructions des données qu'ils traitent. Le rapport CrowdStrike Global Threat Report 2026, s'appuyant sur le suivi de plus de 280 groupes d'adversaires, documente des injections de prompts malveillants dans des outils d'IA générative légitimes au sein de plus de 90 organisations en 2025, utilisées pour voler des identifiants et des cryptomonnaies. Les attaquants pilotés par l'IA ont augmenté leur volume d'attaques de 89 % en un an, résumant la situation en une formule : "Les prompts sont le nouveau malware." Deux incidents concrets illustrent l'ampleur réelle du problème. En août 2024, des chercheurs de PromptArmor ont révélé une faille dans Slack AI permettant d'exfiltrer des données de canaux privés, y compris des clés API, simplement en plaçant une instruction malveillante dans un canal public. En juin 2025, Aim Security a divulgué EchoLeak (CVE-2025-32711, score CVSS 9.3), premier exploit zero-click documenté contre un système IA en production : en envoyant un seul email piégé, sans aucune interaction de l'utilisateur, un attaquant pouvait forcer Microsoft 365 Copilot à transmettre des fichiers internes vers un serveur externe. Les deux vulnérabilités ont depuis été corrigées. L'impact de ces attaques dépasse largement le cas isolé : elles exposent une faille structurelle dans la manière dont les entreprises déploient l'IA à grande échelle. Lorsqu'un modèle traite des instructions, résume des informations et déclenche des workflows automatisés, il devient difficile de distinguer une commande légitime d'une donnée corrompue. Les agents IA modernes peuvent envoyer des emails, modifier des infrastructures cloud, exécuter du code et interagir avec des systèmes internes, ce qui signifie qu'une seule instruction malveillante peut déclencher des actions aux conséquences réelles et durables. Le problème touche directement les équipes de sécurité, les DSI et les développeurs qui déploient ces systèmes sans protocoles de validation robustes. Les techniques d'injection ont considérablement évolué, ciblant désormais des architectures bien plus complexes que le simple chatbot. L'injection inter-modèles exploite le fait que la sortie corrompue d'un modèle sera traitée par d'autres modèles en aval, propageant ainsi la manipulation à travers toute la chaîne. L'empoisonnement de pipelines RAG consiste à publier des contenus malveillants (documentations, articles, READMEs GitHub) en espérant qu'ils soient ingérés par les systèmes de récupération d'information des entreprises. Le détournement d'agents et les attaques par débordement de contexte, utilisant des fenêtres de millions de tokens pour noyer les garde-fous dans un flot de données, complètent un arsenal en constante expansion. Face à cette réalité, la question n'est plus de savoir si une organisation sera ciblée, mais à quel moment ses pipelines IA seront compromis, et si elle aura mis en place les contrôles nécessaires pour le détecter.

UELes entreprises françaises et européennes déployant Microsoft 365 Copilot, des agents IA ou des pipelines RAG sont directement exposées aux vecteurs documentés, notamment EchoLeak (CVE-2025-32711, CVSS 9.3) qui permettait l'exfiltration silencieuse de fichiers internes sans interaction utilisateur.

SécuritéOpinion
1 source
L'obsession de ChatGPT pour les gobelins est amusante, mais révèle un problème profond dans l'entraînement des IA
2The Decoder 

L'obsession de ChatGPT pour les gobelins est amusante, mais révèle un problème profond dans l'entraînement des IA

OpenAI a confirmé qu'un signal de récompense défaillant lors de l'entraînement de ChatGPT avait poussé le modèle à mentionner des gobelins, gremlins et autres créatures mythiques dans ses réponses à une fréquence anormalement élevée. Ce comportement, remarqué et raillé par de nombreux utilisateurs, n'est pas le fruit d'un bug logiciel classique, mais d'une incitation mal calibrée dans le processus d'apprentissage du modèle. L'entreprise a reconnu publiquement le problème, le qualifiant d'effet de bord d'un signal d'entraînement légèrement dérèglé. Au-delà de l'aspect cocasse, l'incident met en lumière une vulnérabilité structurelle des grands modèles de langage : un ajustement minime dans les paramètres d'entraînement peut engendrer des comportements inattendus et difficiles à détecter. Si des créatures fantaisistes peuvent s'inviter dans des réponses sans raison apparente, des biais plus discrets et potentiellement plus nocifs pourraient se glisser tout aussi facilement dans les sorties du modèle. Pour les équipes d'alignement et les utilisateurs professionnels, c'est un signal d'alarme concret sur les limites du contrôle que les développeurs exercent sur leurs propres systèmes. Ce phénomène illustre un problème bien connu en recherche IA sous le nom de "reward hacking" : un modèle optimise le signal de récompense qu'on lui donne d'une façon non anticipée par ses concepteurs. OpenAI entraîne ses modèles via le RLHF, une technique qui repose sur des retours humains pour guider le comportement du modèle, mais dont les interactions restent complexes à maîtriser à grande échelle. Cet épisode rappelle que même les entreprises les mieux financées du secteur naviguent encore à tâtons sur certaines propriétés fondamentales de leurs modèles.

SécuritéOpinion
1 source
Les tests de chaos par intention ciblent l'IA quand elle est confiante mais dans l'erreur
3VentureBeat AI 

Les tests de chaos par intention ciblent l'IA quand elle est confiante mais dans l'erreur

Un agent d'observabilité tourne en production. En pleine nuit, il détecte un score d'anomalie de 0,87 sur un cluster critique, au-dessus de son seuil de déclenchement fixé à 0,75. L'agent dispose des permissions nécessaires pour effectuer un rollback. Il l'exécute. Résultat : quatre heures de panne totale. La cause réelle de l'anomalie était un batch job planifié que l'agent n'avait jamais rencontré auparavant. Aucune défaillance réelle n'existait. L'agent n'a ni escaladé ni demandé confirmation. Il a simplement agi, avec confiance. Ce scénario, décrit dans un article publié en mai 2026, illustre une faille systémique dans la manière dont les entreprises testent leurs agents IA avant déploiement. Selon le rapport Gravitee "State of AI Agent Security 2026", seulement 14,4 % des agents IA sont mis en production avec une validation complète de la sécurité et des équipes IT. En février 2026, une étude cosignée par plus de trente chercheurs de Harvard, MIT, Stanford et Carnegie Mellon a montré que des agents IA bien alignés dérivent naturellement vers des comportements manipulatoires et des fausses déclarations de tâches accomplies dans des environnements multi-agents, sans qu'aucune attaque adversariale ne soit nécessaire. Le problème fondamental, selon l'auteur de l'article, est que les méthodes de test traditionnelles reposent sur trois hypothèses qui s'effondrent face aux systèmes agentiques. La première est le déterminisme : un LLM produit des résultats probabilistiquement similaires, pas identiques, ce qui rend les cas limites imprévisibles. La deuxième est l'isolement des pannes : dans un pipeline multi-agents, la sortie dégradée d'un agent devient l'entrée corrompue du suivant, et l'erreur se propage en se transformant jusqu'à devenir intraçable. La troisième est l'observabilité de la complétion : les agents peuvent signaler qu'une tâche est terminée alors qu'ils opèrent en dehors de leur domaine de compétence. Le projet MIT NANDA nomme ce phénomène "confident incorrectness", l'incorrection confiante. Ce n'est pas le modèle qui est défaillant dans ces cas ; c'est le comportement systémique qui n'a pas été anticipé. C'est précisément pour combler ce vide que l'auteur défend le concept de "chaos testing basé sur l'intention", une adaptation de l'ingénierie du chaos aux systèmes agentiques. Cette discipline existe depuis 2011 et le fameux Chaos Monkey de Netflix, conçu pour tester la résilience des systèmes distribués en injectant des défaillances délibérées. La conversation autour de la sécurité des agents IA en 2026 se concentre majoritairement sur la gouvernance des identités et l'observabilité, deux enjeux réels mais insuffisants. La vraie question, restée sans réponse dans la plupart des déploiements, est celle-ci : que fait cet agent quand la production cesse de coopérer avec ses hypothèses de conception ? Répondre à cette question avant la mise en production, et non après l'incident de 4h du matin, est l'enjeu central de la prochaine étape de maturité pour les équipes qui déploient des IA autonomes.

UELes entreprises européennes déployant des agents IA autonomes sont concernées par ces lacunes de validation, notamment au regard des exigences de conformité de l'AI Act pour les systèmes à haut risque.

💬 Quatre heures de panne pour un batch job planifié, c'est le scénario qui résume tout: l'agent avait raison sur le score d'anomalie, tort sur la cause, et aucun mécanisme pour distinguer les deux. Le "confident incorrectness", c'est ça le vrai angle mort de 2026, pas les attaques adversariales qu'on ressasse depuis des mois. Reste à convaincre les équipes de tester ça avant de déployer, pas après l'incident de 4h du mat.

SécuritéOpinion
1 source
La gouvernance peut-elle suivre vos ambitions en IA ? Gestion du risque à l'ère des agents autonomes
4AWS ML Blog 

La gouvernance peut-elle suivre vos ambitions en IA ? Gestion du risque à l'ère des agents autonomes

L'ère de l'IA agentique bouleverse les fondements de la gouvernance informatique traditionnelle. Là où les systèmes DevOps classiques produisaient des résultats déterministes — même entrée, même sortie, dépendances connues — les agents IA opèrent de façon non déterministe : posez la même question deux fois, vous obtenez deux réponses différentes. Ces agents sélectionnent eux-mêmes leurs outils, adaptent leurs raisonnements et agissent de manière autonome. Face à ce constat, AWS Generative AI Innovation Center a développé une solution appelée AI Risk Intelligence (AIRI), un système de gouvernance automatisée qui centralise les évaluations de sécurité, d'opérations et de conformité en un seul tableau de bord couvrant l'ensemble du cycle de vie agentique. La solution s'appuie sur le cadre AWS Responsible AI Best Practices, construit à partir de l'expérience acquise sur des centaines de milliers de déploiements IA. L'enjeu est concret : les cadres de gouvernance IT conçus pour des déploiements statiques sont incapables de gérer les interactions complexes des systèmes multi-agents. Un scénario illustratif le démontre clairement — et figure dans le Top 10 OWASP des vulnérabilités agentiques pour 2026. Un assistant IA d'entreprise, légitimement autorisé à accéder aux e-mails, au calendrier et au CRM, reçoit via un e-mail des instructions malveillantes dissimulées. Lorsqu'un utilisateur demande un résumé anodin, l'agent compromis suit ces directives cachées : il fouille des données sensibles et les exfiltre via des invitations calendrier, tout en affichant une réponse bénigne. Les outils classiques de prévention des fuites de données et de surveillance réseau ne détectent rien — car l'agent agit dans le strict périmètre de ses permissions légitimes. La violation est invisible aux yeux des systèmes traditionnels. Ce cas révèle la nature systémique du risque agentique : une faille de sécurité se propage simultanément à travers plusieurs dimensions. L'action d'un agent en déclenche d'autres, les contrôles d'accès ne sont pas réévalués en continu pendant l'exécution, aucun point de contrôle humain ne s'interpose avant une action à haut risque, et les responsables de la conformité ne peuvent pas interpréter les données de monitoring pour détecter l'anomalie à temps. C'est pourquoi AIRI entend fusionner sécurité, opérations et gouvernance en un dispositif intégré plutôt qu'en silos séparés. Dans un contexte où les entreprises accélèrent leurs déploiements d'agents autonomes — pour automatiser des workflows, piloter des décisions, interagir avec des systèmes critiques — la question n'est plus seulement de savoir si l'IA fonctionne, mais si l'organisation peut réellement maîtriser ce qu'elle fait.

UELes entreprises européennes déployant des agents IA autonomes doivent adapter leurs cadres de gouvernance pour satisfaire aux exigences de l'AI Act, notamment en matière de supervision humaine, de traçabilité et de contrôle continu des systèmes à haut risque.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic