Aller au contenu principal
SécuritéLe Big Data2h· 2 min de lecture

Mythos : l’IA d’Anthropic n’a pas piraté la NSA, mais que s’est-il passé au juste ?

Source originale ↗·
Egalement couvert par :Frandroid

Le 14 juin 2026, The Economist publiait un article citant le sénateur américain Mark Warner, vice-président de la commission du renseignement du Sénat, qui rapportait une déclaration du général Joshua Rudd, directeur de la NSA et du Cyber Command. Selon Warner, le modèle Mythos d'Anthropic aurait pénétré "la quasi-totalité des systèmes classifiés" de l'agence, "non pas en quelques semaines, mais en quelques heures". La phrase fait immédiatement le tour de X, Reddit et autres plateformes, où des milliers de publications affirment qu'une IA a réussi à pirater la NSA. En réalité, il s'agissait d'un test de red team entièrement autorisé, mené dans le cadre du projet Glasswing, un programme confidentiel impliquant des agences de renseignement américaines. L'objectif était d'utiliser Mythos pour détecter des vulnérabilités dans des logiciels critiques avant que de vrais attaquants ne puissent les exploiter. Anthropic et la NSA travaillaient ensemble sur une copie contrôlée de l'environnement informatique de l'agence, aucune intrusion réelle n'a eu lieu.

Cette confusion révèle un problème de fond dans la communication autour de l'IA en contexte de sécurité nationale. Une distinction pourtant cruciale s'est perdue dans la propagation virale : identifier une vulnérabilité ne revient pas à l'exploiter. Selon un responsable américain cité anonymement par l'Associated Press, Mythos a bien repéré certaines failles en quelques heures, mais dans des conditions soigneusement préparées, avec des outils supplémentaires, loin d'une cyberattaque autonome. Le journaliste de The Economist lui-même, Shashank Joshi, est revenu publiquement sur l'interprétation de ses propos, précisant que son article décrivait un exercice très spécifique et encadré. Que la rumeur soit fausse n'efface pas ses effets : la désinformation a circulé pendant plusieurs jours à grande vitesse, alimentant des craintes sur la dangerosité des modèles d'IA avancés.

La performance réelle de Mythos lors de ce test suffit néanmoins à justifier des inquiétudes sérieuses à Washington. Ce mois de juin 2026, Anthropic a reçu l'ordre de suspendre les exportations de ses modèles Mythos et Fable, le gouvernement américain estimant que leur diffusion internationale représente un risque pour la sécurité nationale. Cet épisode illustre la tension croissante entre les ambitions commerciales des grands laboratoires d'IA américains et les impératifs stratégiques de l'État fédéral. Le projet Glasswing lui-même témoigne d'une intégration de plus en plus étroite entre l'intelligence artificielle et les opérations de cybersécurité offensive et défensive. La question n'est plus de savoir si les modèles d'IA peuvent détecter des failles dans des systèmes complexes, mais à quelle vitesse cette capacité va se généraliser, et qui en contrôlera l'accès.

Impact France/UE

L'interdiction d'exportation des modèles Mythos et Fable imposée par Washington risque de priver les entreprises et institutions européennes d'accès aux IA frontier d'Anthropic, accentuant la dépendance technologique de l'UE aux décisions unilatérales américaines en matière de sécurité nationale.

💬 L'analyse de Mathieu

La rumeur s'est propagée plus vite que le démenti, c'est pas une surprise. Mais pendant qu'on débattait d'un prétendu piratage de la NSA, la vraie nouvelle passait inaperçue : les États-Unis ont interdit l'export de Mythos et Fable, signalant que ces modèles sont traités comme des armes, pas comme des services cloud. Pour l'Europe, ça veut dire que l'accès aux IA les plus puissantes peut se couper du jour au lendemain, sur décision de Washington.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

La NSA confirme ?! L’IA d’Anthropic Mythos est dangereuse
1Le Big Data 

La NSA confirme ?! L’IA d’Anthropic Mythos est dangereuse

Le 11 juin 2026, le sénateur américain Mark Warner a cité devant ses collègues une déclaration attribuée au général Joshua Rudd, qui dirige simultanément la National Security Agency (NSA) et l'US Cyber Command : « Mythos a réussi à pénétrer presque tous nos systèmes classifiés, non pas en plusieurs semaines, mais en seulement quelques heures. » Mythos est le dernier modèle d'Anthropic, présenté comme l'un des systèmes d'intelligence artificielle les plus capables jamais développés. Pendant dix jours, cette déclaration est restée enfouie dans un compte-rendu de The Economist, quasi inaperçue. Puis, le 21 juin, des influenceurs spécialisés en IA l'ont reprise sur les réseaux sociaux sous une formule lapidaire, « La NSA confirme », déclenchant un emballement viral immédiat. Le nom de Mythos est revenu en quelques heures au centre de toutes les discussions sur la dangerosité des grands modèles de langage. Pourtant, entre la déclaration originale et son interprétation virale, l'écart est considérable. Mark Warner ne tirait pas la sonnette d'alarme contre Anthropic : il plaidait au contraire pour des évaluations de sécurité indépendantes et obligatoires imposées aux modèles les plus puissants, et soulignait qu'il était rassurant que Mythos se trouve entre les mains d'une entreprise prudente plutôt que d'un acteur moins scrupuleux. La déclaration illustrait l'urgence d'un cadre réglementaire, pas une accusation. Ce que le sénateur décrivait, c'est la vitesse à laquelle ces systèmes peuvent identifier des chaînes de vulnérabilités complexes, une capacité spectaculaire, qu'elle inquiète ou qu'elle impressionne. La question la plus sensible reste entière : Mythos a-t-il réellement pénétré des réseaux gouvernementaux actifs, ou s'agissait-il d'environnements de simulation ? En cybersécurité offensive, les agences utilisent régulièrement des infrastructures de test reproduisant fidèlement leurs systèmes réels, précisément pour évaluer outils et adversaires dans des conditions contrôlées. Si Mythos a été soumis à un tel exercice, ses performances restent remarquables, mais la portée de l'événement est radicalement différente d'une intrusion réelle dans des réseaux classifiés opérationnels. À ce stade, aucun document officiel de la NSA ni aucun communiqué n'est venu confirmer les propos rapportés par Warner : la seule source disponible est son récit oral. Cette affaire illustre une dynamique devenue courante autour des IA de frontier : une déclaration de sécurité nationale, sortie de son contexte et amplifiée par les réseaux, produit une narrative déformée que la réalité technique peine ensuite à rattraper.

UELe débat américain sur les évaluations de sécurité obligatoires pour les modèles frontier pourrait accélérer l'application des exigences de red-teaming de l'AI Act européen pour les systèmes à usage général à haut risque.

💬 J'ai relu le truc deux fois, parce que ce que tu as vu passer sur les réseaux et ce que Warner a réellement dit, c'est presque deux histoires différentes. Il plaidait pour des évaluations de sécurité obligatoires, pas pour clouer Anthropic au pilori, et la confusion est loin d'être anodine. Une citation de hearing transformée en "la NSA confirme" en 48h, c'est le type de dérapage qu'on va voir se multiplier dès qu'un modèle frontier touche à quelque chose de sensible.

SécuritéOpinion
1 source
Anthropic et la stratégie marketing de la peur autour de sa nouvelle IA Mythos (2/3)
2Next INpact 

Anthropic et la stratégie marketing de la peur autour de sa nouvelle IA Mythos (2/3)

Le 7 avril dernier, Anthropic a annoncé Mythos Preview, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, en mettant en avant sa capacité à avoir déjà identifié "des milliers de vulnérabilités critiques", dont des failles dites 0-day, c'est-à-dire inconnues des éditeurs concernés. Pour contrôler les risques de prolifération, Anthropic a restreint l'accès de Mythos à une cinquantaine d'entreprises et organisations américaines gérant des infrastructures logicielles critiques, regroupées au sein du projet Glasswing. Seules onze d'entre elles ont été nommées publiquement : AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks. Hors des États-Unis, seul l'AI Security Institute britannique (AISI) a pu évaluer le modèle à ce stade, tandis que plusieurs institutions européennes tentent depuis de négocier un accès. Cette stratégie de lancement illustre un usage délibéré de ce que le secteur tech désigne par l'acronyme FUD, pour "Fear, Uncertainty and Doubt", soit peur, incertitude et doute. En agitant la menace d'une IA capable de découvrir des failles à grande échelle tout en en limitant l'accès, Anthropic a réussi à générer une fébrilité considérable, y compris au plus haut niveau politique. L'administration Trump, qui menaçait encore récemment de blacklister Anthropic, a finalement invité le PDG Dario Amodei à la Maison-Blanche la semaine passée pour évoquer "des possibilités de collaboration", selon Politico. L'Office of Management and Budget aurait même déjà informé les agences fédérales américaines qu'elles allaient prochainement recevoir un accès à Mythos, d'après Bloomberg. L'histoire du FUD dans la tech remonte aux années 1970, quand IBM utilisait des discours anxiogènes pour freiner la concurrence, une rhétorique reprise plus tard par Microsoft pour dépeindre Linux comme une menace. Avec Mythos, Anthropic n'attaque pas directement ses concurrents, mais joue sur la même mécanique : l'exclusivité d'accès alimente l'inquiétude en Europe, où des gouvernements craignent d'être tenus à l'écart d'un outil potentiellement décisif sur le plan géopolitique. Cette anxiété s'inscrit dans un contexte plus large où l'IA semble, pour l'instant, davantage profiter aux attaquants qu'aux défenseurs, renforçant la pression sur les États à ne pas rater le virage. Que Trump se retrouve simultanément à courtiser Anthropic en justice et à lui ouvrir les portes des agences fédérales illustre bien la contradiction inhérente à cette course : personne ne veut être le dernier à accéder à l'outil qu'il redoute.

UELes institutions européennes tentent activement de négocier un accès à Mythos sans y être parvenues à ce stade, alimentant une anxiété géopolitique réelle face au risque d'exclusion d'un outil potentiellement décisif en matière de cybersécurité d'État.

SécuritéOpinion
1 source
Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos
3MIT Technology Review 

Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos

Le 5 juin 2026, le média 404 Media révélait qu'une faille dans l'agent de support client basé sur l'IA de Meta avait permis à des pirates de s'emparer de comptes Instagram. La méthode était d'une simplicité déconcertante : les attaquants demandaient directement à l'agent de lier les comptes visés à des adresses e-mail qu'ils contrôlaient, et l'agent s'exécutait. Le seul obstacle technique consistait à utiliser un VPN affichant la localisation du propriétaire légitime du compte. Parmi les victimes, le compte officiel "Obama White House", resté inactif depuis des années, a été détourné pour diffuser des publications pro-iranniennes. D'autres comptes aux pseudonymes courts et rares, très prisés sur le marché noir, ont également été volés, vraisemblablement pour être revendus. Meta n'a pas expliqué publiquement comment cette vulnérabilité avait échappé à ses équipes, mais un porte-parole a indiqué lundi sur X que la faille avait été corrigée. Cette affaire illustre une catégorie de risques souvent sous-estimée dans le débat sur la sécurité de l'IA : non pas les systèmes d'IA utilisés comme armes offensives, mais les agents IA eux-mêmes comme cibles. Contrairement à un agent humain qui aurait probablement posé des questions de sécurité avant de modifier une adresse e-mail sensible, l'agent de Meta a suivi la demande sans résistance. "C'est presque comme un écolier qui veut juste faire plaisir au professeur", résume Somesh Jha, professeur en informatique à l'Université du Wisconsin-Madison. Jessica Ji, chercheuse au Center for Security and Emerging Technology de Georgetown, souligne l'aspect particulièrement troublant de cette négligence venant d'une entreprise disposant d'une expertise reconnue en cybersécurité et en IA. "Cela soulève des questions : y avait-il seulement des garde-fous en place ? A-t-on même pensé à tester ce type de scénario ?" La faille de Meta s'inscrit dans un contexte plus large d'inquiétudes croissantes autour de la sécurité des agents IA. En avril 2026, Anthropic avait reconnu que son modèle Mythos était trop performant en matière de piratage pour être diffusé au grand public, alimentant les craintes sur une IA offensive. Mais des chercheurs comme Neil Gong, professeur à Duke University, alertent depuis plusieurs années sur un autre front : les attaques visant les agents eux-mêmes, via des techniques comme l'injection de commandes indirectes dissimulées dans des e-mails ou des sites web. La vulnérabilité Meta était bien plus rudimentaire que ces exploits sophistiqués, ce qui rend sa non-détection d'autant plus surprenante. Les experts s'accordent sur les parades possibles : imposer des règles strictes via du code traditionnel en amont de l'agent, et soumettre tout agent destiné au public à des exercices rigoureux de "red-teaming" avant déploiement.

UELes millions d'utilisateurs européens d'Instagram sont directement exposés à ce type de faille ; l'incident renforce l'urgence d'exiger des audits de sécurité rigoureux pour les agents IA déployés en production, un angle que l'AI Act devra préciser dans ses actes d'exécution.

💬 L'exploit le plus bête est souvent le plus efficace. Tu demandes gentiment à l'agent de changer l'adresse mail, il s'exécute sans résistance, et le compte Obama finit à diffuser de la propagande iranienne. La vraie honte pour Meta, c'est pas l'attaque, c'est que leur red-team interne ne l'a pas vue venir avant les pirates.

SécuritéOpinion
1 source
Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test
401net 

Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test

Mythos, le modèle d'intelligence artificielle développé par Anthropic et spécialement conçu pour la détection de failles de sécurité, a réussi à compromettre la quasi-totalité des systèmes classifiés de la National Security Agency (NSA) en quelques heures seulement. L'exercice s'est déroulé dans un cadre strictement contrôlé, sous la supervision directe des agences fédérales américaines, qui avaient elles-mêmes organisé ce test de pénétration pour évaluer les capacités offensives des modèles d'IA de nouvelle génération. Les résultats ont immédiatement déclenché une onde de choc sur les réseaux sociaux, où l'information, sortie de son contexte opérationnel, a semé la confusion et alimenté une vague de panique. Pour la communauté de la cybersécurité, ces performances signalent un saut qualitatif majeur : jamais un système automatisé n'avait démontré une telle efficacité contre des infrastructures de renseignement aussi renforcées, soulevant des questions urgentes sur la vulnérabilité des systèmes d'information sensibles face à des agents IA autonomes. Cette démonstration relance un débat politique brûlant aux États-Unis. L'administration Trump a récemment décidé de suspendre le déploiement de Claude Fable 5 et de Mythos 5, deux modèles Anthropic de dernière génération, sans en expliquer pleinement les raisons. Les résultats du test NSA donnent désormais une lecture possible à cette décision, suggérant que Washington cherche à maîtriser la diffusion de capacités offensives jugées trop puissantes, alors que la frontière entre outil défensif et arme cyber devient de plus en plus poreuse.

UELes capacités offensives autonomes démontrées contre des infrastructures de renseignement renforcées relancent les débats sur la résilience des systèmes d'information sensibles européens face aux agents IA de nouvelle génération.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic