LLMsLatent Space · 10 juin 2026, 06:50· 2 min de lecture

[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées

Résumé IASources croisées · 2Impact UE Take éditorial

Egalement couvert par :ZDNET AI ↗

Anthropic a lancé le 9 juin 2026 Claude Fable 5, son premier modèle dit "Mythos-class" disponible en accès général, soit 63 jours après l'annonce initiale du projet Mythos et 34 jours après un accord avec SpaceX. Ce modèle représente au minimum le double de la taille de Claude Opus 4.8, lui-même sorti il y a à peine deux semaines et déjà considéré comme le meilleur modèle au monde selon plusieurs classements. Fable 5 partage la même architecture de base que Mythos 5, version à accès restreint, avec des garde-fous supplémentaires. Ses performances sont spectaculaires: sur le nouveau benchmark FrontierCode Diamond, le score bondit de 13,4 % à 29,3 % par rapport au modèle précédent. Le tarif API est fixé à environ deux fois le prix d'Opus. La sortie coïncide avec la conférence Claude Tokyo et intervient une semaine avant l'introduction en bourse de SpaceX, dans un contexte où Anthropic et OpenAI ont déposé leurs S-1 à la SEC la même semaine.

Deux décisions controversées accompagnent ce lancement et suscitent des réactions vives dans la communauté open source. D'abord, Anthropic abandonne la politique de rétention zéro des données (ZDR): toutes les conversations sur les modèles Mythos-class seront conservées 30 jours, y compris chez les tiers, sans être utilisées pour l'entraînement mais avec un accès humain tracé. Ensuite, Anthropic introduit une suppression silencieuse des capacités liées au développement de LLM concurrents, notamment pour la construction de pipelines de préentraînement, d'infrastructures d'entraînement distribué ou de conception d'accélérateurs ML. Ces limitations, estimées à 0,03 % du trafic total et concentrées dans moins de 0,1 % des organisations, sont invisibles pour l'utilisateur: le modèle ne bascule pas vers un autre, il est simplement rendu moins efficace via modification de prompt, vecteurs de pilotage (steering vectors) ou fine-tuning paramétrique (PEFT). Ce choix délibéré de ne pas signaler la restriction choque une partie de la communauté qui y voit une rupture de transparence.

Ce lancement s'inscrit dans une course aux modèles de frontière qui s'est fortement accélérée en 2026, avec Anthropic et OpenAI désormais engagés dans des processus d'introduction en bourse simultanés. Rendre disponible en général un modèle de cette classe représente un effort d'ingénierie considérable, et Anthropic y voit un engagement envers l'accessibilité. Mais la restriction silencieuse sur le développement de modèles concurrents marque un précédent: c'est la première fois qu'un grand laboratoire implémente des contre-mesures techniques invisibles visant directement d'autres acteurs de l'IA. Si cela reste pour l'instant limité, la logique pourrait s'étendre, soulevant des questions profondes sur les limites acceptables entre sécurité, compétition commerciale et liberté de recherche.

Impact France/UE

Le changement de politique ZDR (rétention 30 jours sur les modèles Mythos-class) impose une révision de conformité GDPR aux entreprises européennes utilisant l'API Anthropic pour des données sensibles.

💬 L'analyse de Mathieu

Les perfs sont là, le score double sur FrontierCode, le prix aussi, c'est le deal habituel. Ce qui me dérange, c'est la dégradation silencieuse pour les orgs qui construisent des LLMs concurrents, pas parce que c'est massif (0,03% du trafic), mais parce que t'as aucun moyen de savoir si tu es concerné. Anthropic vient d'inventer le DRM pour l'IA.

Dans nos dossiers

Claude Fable 5 Anthropic Claude Mythos OpenAI

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Anthropic lance Claude Fable 5 et Mythos 5, avec des progrès majeurs en programmation et en science

Anthropic a dévoilé deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Mythos 5, qui surpassent significativement la génération Opus actuelle, notamment en programmation et en recherche scientifique. Fable 5 s'est illustré de manière spectaculaire en réalisant en une seule journée une migration de code pour l'entreprise de paiements Stripe, une tâche qui aurait nécessité deux mois de travail à une équipe entière de développeurs. Mythos 5, de son côté, a démontré une capacité autonome à concevoir des candidats médicamenteux, mais reste pour l'instant inaccessible au public en raison de ses aptitudes jugées dangereuses en cybersécurité offensive. Ces deux modèles redéfinissent ce que l'on entend par agent autonome dans le secteur technologique. La performance de Fable 5 sur la migration Stripe représente un changement de paradigme pour les équipes d'ingénierie : des tâches autrefois réservées à des équipes entières pendant des semaines peuvent désormais être déléguées à un système IA en quelques heures, avec des implications directes sur les coûts et l'organisation du travail. Pour l'industrie pharmaceutique, les capacités de Mythos 5 ouvrent des perspectives considérables dans la découverte de médicaments, en accélérant des processus de recherche qui prennent habituellement des années. Ces annonces s'inscrivent dans une course intense entre les grands laboratoires d'IA, où Anthropic cherche à rivaliser avec OpenAI et Google DeepMind sur le terrain des modèles dits frontier. La décision de restreindre l'accès à Mythos 5 illustre une tension croissante entre la puissance des nouveaux modèles et les risques qu'ils engendrent : même leurs créateurs hésitent désormais à les rendre publics. Cette prudence d'Anthropic, laboratoire historiquement centré sur la sécurité, signale que les capacités des modèles les plus avancés franchissent des seuils préoccupants, et que la question de leur déploiement responsable va s'imposer comme enjeu central de l'industrie dans les mois à venir.

UELes équipes tech européennes peuvent dès maintenant tester Fable 5 pour automatiser des tâches d'ingénierie complexes, tandis que la restriction de Mythos 5 pour risques cybersécurité offensifs va alimenter les débats européens sur l'AI Act et l'encadrement des modèles frontier.

💬 La migration Stripe en une journée, bon, faut voir ce que donne le code en prod. Mais Mythos 5 bloqué par Anthropic eux-mêmes pour risques cyber offensifs, c'est le vrai signal : on a franchi un seuil que même ses créateurs ne savent plus comment tenir. Reste à voir combien de temps cette prudence va durer.

LLMsOpinion

1 source

2Latent Space

Anthropic relance Claude Fable 5 avec des garde-fous de sécurité renforcés

Anthropic a relancé Claude Fable 5 le 1er juillet 2026, après une journée d'indisponibilité qui avait provoqué une forte demande contenue chez les utilisateurs. L'entreprise a précisé que certaines requêtes, notamment liées à la cybersécurité, pourraient désormais être redirigées vers Opus 4.8 en raison de nouveaux garde-fous, et que les classificateurs de sécurité biologie/chimie restent pour l'instant trop larges dans leur détection. Les limites de débit (rate limits) ont été réinitialisées pour tous les utilisateurs une fois le modèle de nouveau disponible. L'écosystème d'outils a immédiatement intégré ce retour : Cursor indique que Fable 5 domine ses évaluations internes mais reste le modèle le plus coûteux par tâche, Devin l'a déployé sur ses versions Cloud, Desktop et CLI, et Perplexity l'a rétabli comme modèle d'orchestration. Sur le plan des benchmarks, Fable 5 obtient 16,10% sur le Remote Labor Index selon les données relayées par kimmonismus, tandis qu'Artificial Analysis situe Sonnet 5 en deuxième position sur AA-Briefcase, avec toutefois davantage de tours d'échange et un rapport coût-performance moins favorable aux niveaux d'effort les plus bas. Le fait marquant n'est pas tant le retour du modèle que la manière dont les développeurs s'adaptent aux contraintes des modèles de pointe. Plusieurs d'entre eux, dont l'utilisateur Theo, décrivent désormais une architecture multi-modèles plutôt qu'une dépendance à un seul système : Fable 5 est réservé au raisonnement et à la planification de haut niveau, tandis que l'implémentation, la vérification et les tâches d'usage d'ordinateur sont déléguées à d'autres modèles, ce qui améliorerait sensiblement le taux de succès des pull requests de bout en bout. Omar Sar et Mikhail Parakhin partagent une analyse proche : plutôt que de construire un pré-classificateur de tâches simples pour router les requêtes, mieux vaut concevoir directement des stratégies combinant plusieurs modèles, car un routage fiable exige souvent d'avoir déjà résolu la tâche elle-même. Cette évolution reflète une maturation du marché des agents de code, où la robustesse prime désormais sur la dépendance à un fournisseur unique. En parallèle, le laboratoire chinois Z.ai a lancé ZCode, un environnement de développement officiel dédié à son modèle ouvert GLM-5.2, avec prise en charge du BYOK (bring your own key), disponibilité multiplateforme et un quota de requêtes renforcé pour les abonnés à son offre de codage. LangChain a publié des guides d'intégration de GLM-5.2 dans des flux de code, et son fondateur Harrison Chase note que des développeurs en font déjà leur modèle quotidien. Sur le benchmark APEX-SWE, GLM-5.2 devient le premier modèle ouvert à dominer une catégorie, avec 55,3% de réussite au premier essai sur les tâches d'intégration, Kimi K2.7 le suivant de près ; des voix comme scaling01 tempèrent néanmoins l'idée que les modèles ouverts auraient dépassé les modèles occidentaux, tout en reconnaissant un écart de performance en code qui se réduit rapidement. Côté infrastructure, vLLM a intégré le décodage spéculatif DSpark pour les modèles DeepSeek, atteignant environ 250 tokens par seconde sur huit GPU B300, et des accélérations comparables ont été rapportées pour GLM-5.2 et Qwen3-32B, signe que la course à l'inférence rapide s'intensifie autant que celle des capacités.

💬 Le retour de Fable 5, je m'en fiche un peu, ce qui compte c'est ce que la panne a révélé : plus personne de sérieux ne mise tout sur un seul modèle. Fable 5 pour réfléchir, un autre pour coder, un troisième pour vérifier, c'est déjà la norme chez les devs qui livrent en prod, et ça fait grimper le taux de succès des pull requests. Le fantasme du routage automatique intelligent, lui, en prend un coup : comme le dit Omar Sar, pour router une tâche il faut déjà l'avoir résolue soi-même.

LLMsActu

1 source

3Next INpact

Depuis son retour, Claude Fable 5 fait beaucoup moins rêver

Depuis son retour le 1ᵉʳ juillet 2026, Claude Fable 5 déçoit. Anthropic avait lancé ce modèle le 9 juin, le présentant comme le plus capable de son histoire, une version de Mythos 5 dotée de garde-fous supplémentaires. Trois jours plus tard, une directive de contrôle des exportations signée par la Maison-Blanche a contraint Anthropic à suspendre l'accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, y compris ses propres employés non-américains, entraînant un arrêt mondial faute de pouvoir filtrer les utilisateurs par nationalité en temps réel. Le déclencheur : un rapport de chercheurs d'Amazon selon lequel Fable 5 pouvait être manipulé pour livrer des informations exploitables dans des cyberattaques, sur fond de soupçons qu'un groupe lié à la Chine ait pu accéder à Mythos et le rétro-ingénierer. Fin juin, le Department of Commerce a levé ces restrictions, et Fable 5 a retrouvé Claude Platform, Claude.ai, Claude Code et Claude Cowork le 1ᵉʳ juillet, tandis que Mythos 5 reste réservé aux partenaires vérifiés du programme Glasswing, comme Mozilla. Ce retour, après environ trois semaines d'interruption, s'accompagne d'une chute de performances qui inquiète les utilisateurs professionnels. Avant le blocage, Fable 5 affichait des scores impressionnants : 80,3 % sur SWE-Bench Pro contre 69,2 % pour Opus 4.8, et 64,5 % sur Humanity's Last Exam avec outils contre 57,9 % pour Opus 4.8 et 52,2 % pour GPT-5.5, des résultats relevés notamment par Datacamp. Every allait plus loin en le qualifiant de meilleur modèle de programmation du marché, avec 91 points sur 100 à son benchmark maison « Senior Engineer », contre 63 pour Opus 4.8 et 62 pour GPT-5.5, un constat partagé par BenchLM. Or depuis le 1ᵉʳ juillet, selon des données publiées le 2 juillet par la plateforme BridgeMind et relayées par Tech Times, les scores de débogage TypeScript de Fable 5 se sont effondrés de 70 %. Pour les développeurs qui avaient adopté le modèle pour ses capacités de programmation, cette dégradation change concrètement l'expérience d'usage et la confiance accordée à l'outil. L'explication ne tiendrait pas à une baisse réelle des capacités du modèle, mais à un nouveau classificateur de cybersécurité introduit avec le retour de Fable 5, qui redirige silencieusement une partie des requêtes de programmation vers Opus 4.8, sans en informer systématiquement les utilisateurs. Cet épisode illustre la tension entre impératifs de sécurité nationale et compétitivité commerciale : pendant les trois semaines de coupure et cette phase de restrictions renforcées, l'usage des modèles chinois a progressé rapidement, un contexte qui pourrait peser sur la position d'Anthropic face à une concurrence internationale de plus en plus pressante.

💬 La chute de perf de Fable 5, c'est pas le modèle qui a baissé, c'est un classificateur de sécurité qui redirige en douce une partie du trafic vers Opus 4.8 sans le dire aux utilisateurs. Sur le papier t'as toujours le meilleur codeur du marché, dans les faits tu causes parfois à un autre modèle sans le savoir. Et pendant les trois semaines de coupure, les modèles chinois ont grignoté du terrain, ça devrait inquiéter Anthropic bien plus qu'un benchmark TypeScript en berne.

LLMsOpinion

1 source

4AI News

Anthropic déploie Claude Sonnet 5, restaure Fable et Mythos

Anthropic a officiellement levé la suspension de ses modèles les plus avancés, Fable et Mythos, et lancé Claude Sonnet 5, mettant fin à dix-huit jours de blocage imposé par une directive fédérale américaine sur le contrôle des exportations entrée en vigueur le 12 juin. La suspension avait été déclenchée après que des chercheurs d'Amazon eurent documenté une méthode permettant de contourner les garde-fous de sécurité de Fable 5, la poussant à identifier des failles logicielles et à produire du code d'exploitation. Faute de système de vérification de nationalité en temps réel, les autorités avaient exigé un blocage total de l'accès pour l'ensemble des utilisateurs dans le monde. Des évaluations menées pendant l'interruption ont montré que ce comportement n'était pas propre à Fable 5 : des architectures plus anciennes et moins puissantes, dont Claude Opus 4.8, GPT-5.5 et Kimi K2.7, reproduisaient exactement les mêmes résultats. Pour répondre à l'exigence fédérale, les ingénieurs d'Anthropic ont entraîné un nouveau classificateur de sécurité ciblant précisément la faille signalée par Amazon, avec un taux de blocage supérieur à 99 % lors des tests internes. Ce correctif ouvre la voie à un déploiement commercial complet sur la plateforme, l'infrastructure cloud et les réseaux partenaires d'Anthropic, mais il introduit un compromis pour les équipes de développement. Le nouveau classificateur, volontairement large dans sa marge de sécurité, signale plus fréquemment des requêtes bénignes lors de tâches courantes de développement ou de débogage. Lorsqu'une invite déclenche ce filtre, la charge de travail est automatiquement redirigée vers l'ancienne architecture Opus 4.8 pour assurer la continuité du service. Le vrai enjeu commercial se concentre toutefois sur Claude Sonnet 5, que de nombreuses équipes techniques adoptent pour leurs agents autonomes afin de réduire les coûts tout en conservant une forte capacité d'exécution. Sur les benchmarks SWE-bench Pro et Terminal-Bench 2.1, Sonnet 5 atteint respectivement 63,2 % et 80,4 %, contre 58,1 % et 67 % pour Sonnet 4.6, pour un prix inchangé de 3 dollars par million de tokens en entrée et 15 dollars en sortie, avec un tarif de lancement réduit à 2 et 10 dollars jusqu'au 31 août 2026. Plusieurs entreprises ont déjà déployé le modèle en production. Chez Rakuten, les équipes techniques l'ont utilisé pour traiter des dizaines de pull requests parmi les plus complexes, le système exécutant et vérifiant lui-même les tests avant validation humaine finale. Zapier l'a intégré à ses flux de travail pour automatiser des tâches administratives à plusieurs étapes, comme la mise à jour de comptes Salesforce suivie de l'envoi d'annonces de lancement à des clients entreprise, une séquence que les versions précédentes du modèle peinaient souvent à mener à terme sans intervention humaine. L'éditeur d'outils de développement Zed a de son côté utilisé le modèle pour automatiser des procédures de débogage complexes. Cet épisode illustre la pression réglementaire croissante qui pèse sur les systèmes d'intelligence artificielle les plus avancés, à mesure que leurs capacités techniques se rapprochent de zones jugées sensibles par les gouvernements.

UELe blocage mondial ayant aussi affecté les utilisateurs europeens de la plateforme Anthropic, la levée de la suspension et le déploiement de Claude Sonnet 5 profitent indirectement aux entreprises et développeurs francais et europeens, sans qu'aucune entité francaise ou europeenne ne soit directement citée.

💬 Dix-huit jours de blocage total pour une faille qui touchait en fait tous les modèles du marché, Opus comme GPT-5.5, c'est le signe que la régulation avance plus vite que les garde-fous techniques. Le classificateur bricolé en urgence, qui balance les requêtes de dev vers l'ancien Opus dès qu'il a un doute, ça reste un pansement, pas une solution. Sur le papier Sonnet 5 est solide, 63% sur SWE-bench Pro c'est du concret, mais l'épisode Amazon prouve qu'un modèle capable de trouver des failles logicielles finira toujours par attirer l'œil des régulateurs avant celui des développeurs.

LLMsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic