Anthropic redéploie Claude Fable 5 après la levée des contrôles à l'exportation, ajoute un classificateur cybersécurité
Anthropic a redéployé Claude Fable 5, son modèle le plus performant en accès général, le mercredi 1er juillet, après la levée des contrôles à l'export imposés par le gouvernement américain. Ces restrictions, entrées en vigueur le 12 juin, visaient Fable 5 et son homologue Claude Mythos 5, deux modèles construits sur la même base mais dotés de garde-fous différents, Mythos 5 étant partiellement ouvert aux partenaires de cybersécurité défensive. Une directive gouvernementale limitant leur usage aux personnes non étrangères, qu'Anthropic ne pouvait vérifier en temps réel, avait poussé l'entreprise à suspendre les deux modèles pour tous les utilisateurs. L'élément déclencheur était un rapport de chercheurs d'Amazon ayant découvert une méthode de contournement des protections de Fable 5, permettant au modèle d'identifier plusieurs vulnérabilités logicielles et, dans un cas, de produire du code exploitant l'une d'elles. Le 26 juin, Washington a autorisé la restauration de Mythos 5 pour certaines organisations américaines, avant une levée complète des restrictions le 30 juin. Fable 5 est de nouveau disponible mondialement sur la Claude Platform, Claude.ai, Claude Code et Claude Cowork, au tarif de 10 dollars par million de tokens en entrée et 50 dollars par million en sortie.
Anthropic affirme que la faille détectée n'avait rien d'unique à Fable 5 : des modèles moins puissants comme Claude Opus 4.8, GPT-5.5 ou Kimi K2.7 identifiaient les mêmes vulnérabilités, et l'exploit spécifique a pu être reproduit par pratiquement tous les modèles testés, dont Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, GPT-5.4 et GPT-5.5. L'entreprise qualifie l'incident de cas limite ne relevant pas de capacités cyber propres au niveau Mythos, mais bien de tâches de cybersécurité défensive courantes. Pour combler la brèche, elle a entraîné un nouveau classificateur de sécurité bloquant la technique signalée dans plus de 99 % des cas ; les requêtes interceptées ne sont pas rejetées mais redirigées vers Claude Opus 4.8, avec notification de l'utilisateur. Des chercheurs du CAISI, rattaché au Département du Commerce américain, ont testé les anciennes et nouvelles protections et les jugent extrêmement solides, au prix d'un peu plus de faux positifs lors de tâches de codage ou de débogage classiques, une conséquence assumée de la marge de sécurité volontairement élargie sur Fable 5.
Cet épisode a mis en lumière l'absence de norme commune pour évaluer la gravité d'un jailbreak, une technique permettant de contourner les garde-fous d'un modèle. Anthropic élabore désormais un cadre de notation avec Amazon, Microsoft, Google et d'autres partenaires de l'initiative Glasswing, fondé sur quatre critères : le gain de capacité offert par rapport aux outils existants, l'étendue des tâches offensives débloquées, la facilité à transformer la technique en arme réellement exploitable, et sa facilité de découverte par un tiers. Pour les cas jugés les plus graves selon cette grille, Anthropic prévoit de déployer des mesures d'atténuation préliminaires dès leur détection, sans attendre une correction complète.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



