Aller au contenu principal
SécuritéThe Decoder6sem

Le mythe Claude Mythos s'effondre : de petits modèles open source détectent les mêmes failles de cybersécurité

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

Anthropic présente depuis plusieurs mois Claude Mythos comme un modèle de cybersécurité aux capacités uniques, affirmant qu'aucun concurrent ne peut égaler ses performances dans la détection et l'analyse de vulnérabilités logicielles. Deux nouvelles études indépendantes viennent cependant ébranler cette position : des modèles ouverts de petite taille seraient capables de reproduire la quasi-totalité des analyses de failles que l'entreprise américaine avait mises en avant pour justifier les restrictions d'accès à Mythos.

Ces résultats ont une portée directe sur la stratégie de contrôle adoptée par Anthropic. En limitant l'accès à Mythos au nom d'un risque de sécurité nationale, la société justifiait des barrières d'entrée strictes. Si des modèles open source bien moins lourds atteignent des performances comparables, l'argument tombe en partie : les acteurs malveillants n'ont pas besoin d'accéder à Mythos pour mener des recherches offensives sur des vulnérabilités, ce qui affaiblit la logique même du contrôle d'accès.

Cette controverse s'inscrit dans un débat plus large sur la manière dont les laboratoires d'IA justifient les restrictions imposées à leurs modèles les plus puissants. Anthropic n'est pas le seul à invoquer des risques de double usage pour limiter la diffusion de certains outils, mais la crédibilité de ces arguments dépend directement de l'écart réel entre modèles propriétaires et alternatives ouvertes. Si cet écart se réduit rapidement, la question de la gouvernance des modèles de cybersécurité devra être posée sur d'autres bases que la seule supériorité technique des acteurs fermés.

Impact France/UE

Ce débat sur la gouvernance des modèles IA à double usage pourrait remodeler les discussions européennes autour de l'AI Act, notamment sur la pertinence des restrictions d'accès fondées sur la seule supériorité technique des modèles propriétaires.

💬 Le point de vue du dev

Le vernis craque vite quand les preuves arrivent. Si des petits modèles open source font le même boulot sur la détection de failles, l'argument "accès restreint pour la sécurité nationale" devient difficile à tenir sérieusement. Ce qui reste à régler, c'est comment on régule vraiment, sans se cacher derrière une supériorité technique qui visiblement ne dure pas.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Claude Mythos arriverait enfin en Europe, mais la France n’attend pas les Américains pour s’armer contre les failles de sécurité
1Presse-citron 

Claude Mythos arriverait enfin en Europe, mais la France n’attend pas les Américains pour s’armer contre les failles de sécurité

Anthropic vient d'annoncer l'extension de son programme Claude Mythos à 15 nouveaux pays et 150 nouvelles organisations, dont la France. Parmi les entités désormais autorisées à utiliser cette intelligence artificielle de haute sécurité figurent des institutions stratégiques comme l'OTAN et l'ENISA, l'agence européenne chargée de la cybersécurité. Cette expansion marque une étape significative dans la diffusion de modèles d'IA américains vers les administrations et organisations sensibles du Vieux Continent. L'accès à Claude Mythos représente un enjeu majeur pour les institutions qui traitent des données confidentielles ou classifiées. Contrairement aux versions grand public de Claude, cette offre est conçue pour répondre aux exigences de souveraineté numérique et de sécurité que les gouvernements et agences de défense ne peuvent ignorer. Pour l'OTAN ou l'ENISA, disposer d'un outil d'IA puissant tout en maintenant un contrôle strict sur les données traitées constitue un avantage opérationnel direct dans un contexte de menaces cybernétiques croissantes. Cette ouverture intervient cependant dans un paysage où l'Europe n'attend pas les solutions américaines les bras croisés. Mistral, le champion français de l'IA, développe déjà des alternatives spécifiquement destinées aux banques et autres secteurs régulés qui ne peuvent ou ne souhaitent pas dépendre de technologies étrangères. La concurrence entre modèles américains souverainisés et modèles européens natifs illustre une tension plus large autour de l'autonomie stratégique numérique, question centrale pour les années à venir en matière de gouvernance de l'IA en Europe.

UEL'ENISA et l'OTAN intègrent Claude Mythos pour leurs opérations sensibles, ouvrant la voie à d'autres institutions françaises et européennes, tandis que Mistral positionne ses modèles souverains comme alternative pour les secteurs régulés.

💬 Que l'OTAN intègre Claude Mythos, bon, c'est dans la logique des choses, ils ont besoin d'outils qui tiennent en conditions réelles. Ce qui est plus intéressant, c'est que Mistral se positionne exactement en face pour les secteurs régulés, pas comme "aussi bien que les Américains", mais comme choix souverain assumé. Ce duel-là, c'est celui qu'il faut suivre.

SécuritéOpinion
1 source
2Siècle Digital 

OpenAI travaille sur un modèle de cybersécurité destiné à concurrencer Mythos d’Anthropic

OpenAI prépare un modèle d'intelligence artificielle spécialisé dans la cybersécurité, développé en réponse directe à Mythos, le modèle similaire annoncé par Anthropic quelques jours plus tôt. L'information, rapportée par Axios, révèle que cet outil ne sera pas accessible au grand public : il sera distribué exclusivement à un cercle restreint de partenaires sélectionnés, notamment des entreprises technologiques et des acteurs spécialisés dans la sécurité informatique, selon le même modèle de distribution fermée qu'Anthropic a choisi pour Mythos. Cette approche restrictive reflète les enjeux sensibles liés aux modèles d'IA orientés cybersécurité, capables à la fois de défendre des systèmes et de les attaquer. En réservant l'accès à des partenaires de confiance, OpenAI tente de concilier l'utilité opérationnelle de l'outil avec les risques de détournement à des fins malveillantes. Pour les entreprises de sécurité partenaires, un tel modèle pourrait accélérer la détection de vulnérabilités, l'analyse de malwares et la réponse aux incidents, des tâches aujourd'hui largement manuelles et chronophages. La course entre OpenAI et Anthropic sur ce segment illustre une tendance plus large : les grands laboratoires d'IA cherchent à s'imposer dans des secteurs verticaux à haute valeur ajoutée, après avoir dominé les usages généralistes. La cybersécurité, marché mondial estimé à plusieurs centaines de milliards de dollars, attire également Google, Microsoft et des acteurs spécialisés comme CrowdStrike ou Palo Alto Networks, déjà engagés dans l'intégration de l'IA dans leurs plateformes. La rapidité de la réplique d'OpenAI suggère que ce segment est désormais considéré comme stratégique par les deux entreprises.

UELes entreprises européennes de cybersécurité pourraient accéder à ces modèles spécialisés via des partenariats, accélérant la détection de vulnérabilités et la réponse aux incidents sur le marché européen.

SécuritéActu
1 source
Anthropic : le modèle Mythos marque un tournant pour les risques de cybersécurité liés à l'IA
3The Information AI 

Anthropic : le modèle Mythos marque un tournant pour les risques de cybersécurité liés à l'IA

Anthropic a involontairement rendu public un brouillon de billet de blog révélant l'existence d'un nouveau modèle d'IA baptisé "Mythos", spécialement conçu pour la génération et la révision de code informatique. Selon ce document, le modèle serait capable d'exploiter des vulnérabilités de sécurité "d'une manière qui dépasse largement les efforts des défenseurs". La société a déjà commencé à briefer des chercheurs en cybersécurité et leur accorde un accès anticipé afin de recueillir des retours avant un lancement officiel. L'enjeu est considérable : si un tel modèle tombait entre de mauvaises mains, il permettrait à des hackers peu qualifiés de mener des attaques sophistiquées à grande échelle, creusant davantage l'écart entre attaquants et défenseurs. Anthropic cherche précisément à identifier ces risques avant la mise sur le marché, en s'appuyant sur la communauté des chercheurs pour "red-teamer" le modèle et réduire son potentiel offensif. Cette démarche illustre la tension croissante entre les capacités des LLMs spécialisés dans le code et les impératifs de sécurité. Cette initiative s'inscrit dans une tendance plus large où les grands laboratoires d'IA — OpenAI, Google DeepMind, et désormais Anthropic — développent des modèles hautement performants pour le code, tout en faisant face à des questions épineuses sur leur double usage. Anthropic, qui se positionne comme un acteur responsable de l'IA via sa politique d'"IA constitutionnelle", se retrouve confronté au paradoxe fondamental du domaine : les mêmes capacités qui accélèrent la défense peuvent aussi armer les adversaires. La divulgation accidentelle du brouillon suggère que la pression autour de Mythos est déjà forte en interne.

UELes capacités offensives de modèles comme Mythos représentent une menace directe pour les infrastructures numériques européennes et soulèvent des questions de conformité avec l'AI Act concernant les systèmes IA à double usage.

💬 Un modèle qui dépasse les défenseurs sur leur propre terrain, c'est le scénario qu'on redoutait depuis que les LLMs de code sont vraiment capables. Ce qui compte, c'est qu'Anthropic le dit franchement et organise le red-teaming avant le lancement, pas après. La fuite du draft, c'est maladroit, mais ça confirme surtout que la pression en interne est déjà énorme.

SécuritéOpinion
1 source
Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA
4The Decoder 

Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA

L'Institut de sécurité de l'IA du Royaume-Uni (AISI) vient de réviser à la baisse, pour la deuxième fois, son estimation du rythme de progression des capacités cyber de l'IA. D'abord ramenée de huit à 4,7 mois, cette estimation s'est avérée trop conservatrice : Claude Mythos Preview d'Anthropic et GPT-5.5 d'OpenAI ont dépassé ce seuil révisé. Mythos est devenu le premier modèle à réussir l'intégralité des simulations d'attaques informatiques conçues par l'AISI, une performance qu'aucun système d'IA n'avait atteinte jusqu'ici. Cet accomplissement soulève des interrogations sérieuses sur la vitesse à laquelle les modèles d'IA atteignent des capacités offensives critiques. Que des systèmes commerciaux puissent désormais réussir toutes les simulations d'attaques d'un organisme gouvernemental de sécurité signifie que le fossé entre capacités théoriques et menaces réelles se referme rapidement. Pour les entreprises, gouvernements et infrastructures critiques, cela implique que les défenses actuelles pourraient devenir insuffisantes face à des acteurs malveillants équipés de ces outils. Logan Graham, responsable du red teaming chez Anthropic, tempère pourtant l'ampleur de l'exploit : "D'ici un an, Mythos paraîtra probablement assez limité", a-t-il déclaré. Cette mise en perspective illustre le problème central auquel font face les régulateurs : les benchmarks de sécurité deviennent obsolètes presque aussi vite qu'ils sont établis. L'AISI, créé en 2023 sous l'impulsion du gouvernement britannique pour évaluer les risques des modèles frontier, doit désormais accélérer sa propre cadence d'évaluation pour rester pertinent face à une progression que plus personne ne semble capable d'anticiper correctement.

UELes gouvernements et infrastructures critiques européens devront réviser leurs référentiels d'évaluation cyber, ce milestone influençant directement les exigences de l'AI Act sur les modèles frontier à haut risque.

💬 L'AISI s'est trompé deux fois sur la cadence de progression, et s'est quand même fait dépasser. Le vrai souci, c'est pas qu'un modèle passe tous les tests cyber d'un organisme gouvernemental, c'est que ces tests soient périmés avant même d'être publiés. La citation de Logan Graham résume bien : dans un an, Mythos paraîtra limité, et je pense qu'il n'exagère pas.

SécuritéOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour