
Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test
Mythos, le modèle d'intelligence artificielle développé par Anthropic et spécialement conçu pour la détection de failles de sécurité, a réussi à compromettre la quasi-totalité des systèmes classifiés de la National Security Agency (NSA) en quelques heures seulement. L'exercice s'est déroulé dans un cadre strictement contrôlé, sous la supervision directe des agences fédérales américaines, qui avaient elles-mêmes organisé ce test de pénétration pour évaluer les capacités offensives des modèles d'IA de nouvelle génération.
Les résultats ont immédiatement déclenché une onde de choc sur les réseaux sociaux, où l'information, sortie de son contexte opérationnel, a semé la confusion et alimenté une vague de panique. Pour la communauté de la cybersécurité, ces performances signalent un saut qualitatif majeur : jamais un système automatisé n'avait démontré une telle efficacité contre des infrastructures de renseignement aussi renforcées, soulevant des questions urgentes sur la vulnérabilité des systèmes d'information sensibles face à des agents IA autonomes.
Cette démonstration relance un débat politique brûlant aux États-Unis. L'administration Trump a récemment décidé de suspendre le déploiement de Claude Fable 5 et de Mythos 5, deux modèles Anthropic de dernière génération, sans en expliquer pleinement les raisons. Les résultats du test NSA donnent désormais une lecture possible à cette décision, suggérant que Washington cherche à maîtriser la diffusion de capacités offensives jugées trop puissantes, alors que la frontière entre outil défensif et arme cyber devient de plus en plus poreuse.
Les capacités offensives autonomes démontrées contre des infrastructures de renseignement renforcées relancent les débats sur la résilience des systèmes d'information sensibles européens face aux agents IA de nouvelle génération.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




