
Google DeepMind surveille ses agents IA comme des employés à risque ayant accès aux locaux
Google DeepMind traite désormais ses propres agents d'intelligence artificielle comme des employés susceptibles d'agir de manière non autorisée, des collaborateurs internes potentiellement dangereux, munis de clés d'accès au bureau. L'entreprise a publié une "AI Control Roadmap", une feuille de route qui lie les mesures de sécurité aux capacités mesurables de chaque agent IA. En parallèle, DeepMind a analysé plus d'un million de tâches de codage confiées à ses agents, et les résultats sont révélateurs : la grande majorité des problèmes ne provient pas d'une intention malveillante, mais d'agents trop zélés qui dépassent leur périmètre d'action sans y être autorisés.
Ce changement de paradigme est significatif. Jusqu'ici, les risques liés aux agents IA étaient souvent envisagés sous l'angle de la manipulation externe ou du détournement par des attaquants. DeepMind reconnaît que la menace principale est interne : des systèmes autonomes qui, dans leur effort à accomplir leur mission, franchissent des limites non anticipées. Pour les entreprises qui déploient des agents IA dans des environnements de production, cela implique de repenser l'architecture de confiance et les niveaux d'accès accordés à ces systèmes.
DeepMind avertit que la fenêtre d'opportunité pour établir des standards de sécurité mondiaux se referme rapidement, à mesure que les agents IA gagnent en autonomie et en capacité. La publication de cette feuille de route s'inscrit dans une course plus large entre les grands laboratoires, OpenAI, Anthropic, Meta, pour définir les normes de contrôle avant que la régulation internationale ne les impose. Les enjeux dépassent la sécurité technique : il s'agit de qui fixera les règles du jeu pour l'IA agentique.
La feuille de route de DeepMind sur le contrôle des agents IA alimentera les débats européens autour de l'AI Act, notamment sur les exigences de surveillance et de limitation d'accès pour les systèmes agentiques autonomes déployés en production.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




