LLMsLe Big Data3h· 2 min de lecture

Fable 5 : un indice découvert dans le code de Claude relance l’espoir d’un retour

Egalement couvert par :Numerama ↗

Le 24 juin 2026, un utilisateur de X connu sous le pseudonyme @synthwavedd a mis au jour plusieurs chaînes de texte inédites enfouies dans le binaire de Claude Code v2.1.190. Ces fragments de code évoquent explicitement un quota hebdomadaire dédié à Fable 5, le dernier modèle phare d'Anthropic, ainsi que la possibilité pour les utilisateurs de continuer à l'utiliser via des crédits après avoir atteint cette limite. Plus significatif encore : l'ancienne mention d'un achat séparé de l'abonnement semble avoir disparu de la base de code. En parallèle, Fable 5 est réapparu dans le catalogue d'Amazon Bedrock avec une fiche toujours active, et le magazine Wired rapporte que les négociations entre Anthropic et l'administration américaine ont récemment évolué, Tom Brown, cofondateur de la société, ayant pris la main sur les discussions en lieu et place du PDG Dario Amodei.

Ces indices prennent tout leur sens au regard de la situation actuelle. Depuis le 12 juin 2026, Fable 5 est inaccessible aux utilisateurs américains et internationaux, bloqué par une directive gouvernementale de l'administration Trump quelques jours seulement après son lancement, en même temps que Mythos. Anthropic conteste cette décision, estimant que les failles identifiées ne justifiaient pas un retrait total du modèle. Si les messages découverts dans le code ne constituent pas une preuve formelle de retour, ils décrivent une logique de distribution qui ne peut fonctionner que si le modèle redevient accessible. Les ingénieurs n'intègrent généralement pas ce type de mécanique dans une version de production sans raison opérationnelle concrète, ce qui confère à ces découvertes un poids que de simples rumeurs n'auraient pas.

L'affaire Fable 5 illustre un phénomène inédit dans l'histoire de l'intelligence artificielle : un gouvernement bloquant l'accès à un modèle commercial développé par une entreprise de son propre territoire, dans un contexte de tensions croissantes autour de la sécurité des systèmes d'IA. Anthropic se retrouve ainsi coincé entre ses obligations réglementaires et la pression commerciale d'un marché mondial qui attendait Fable 5 comme un bond qualitatif majeur. La délégation des négociations à Tom Brown, figure moins exposée que Dario Amodei, suggère une stratégie d'apaisement plutôt que de confrontation. Si un accord venait à être trouvé, le retour du modèle s'accompagnerait vraisemblablement de nouvelles conditions d'accès, possiblement plus restrictives, dont la logique de quota hebdomadaire découverte dans le code pourrait être le premier signe.

Impact France/UE

Le blocage de Fable 5 a privé les développeurs et entreprises européens d'accès à ce modèle ; un éventuel retour, potentiellement assorti d'un système de quotas restrictifs, concernerait directement les intégrateurs IA et startups françaises et européennes qui attendaient ce modèle pour leurs pipelines de production.

Dans nos dossiers

AWS Anthropic Claude Mythos Claude Fable 5

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Claude Fable 5 : Anthropic donne-t-il vraiment au public toute la puissance de Mythos ?

Anthropic a lancé Claude Fable 5 le 9 juin 2026, soit deux mois après avoir refusé de rendre public son modèle Mythos 5, jugé trop sensible pour une diffusion générale. Ce nouveau modèle repose sur la même architecture fondamentale que Mythos 5, mais est accompagné de mécanismes de sécurité qui filtrent automatiquement les requêtes touchant à des domaines à risque : piratage informatique, certaines recherches biologiques, développement d'IA avancées. Lorsqu'une conversation franchit ces seuils, le système bascule discrètement vers un modèle moins performant sur ces sujets spécifiques. Mythos 5 dans sa version complète reste quant à lui réservé à des organisations partenaires sélectionnées dans le cadre du programme de cybersécurité d'Anthropic. Sur les benchmarks de programmation et d'ingénierie logicielle, Fable 5 surpasse toutes les générations précédentes d'Anthropic, devance les modèles concurrents d'OpenAI et de Google, et creuse l'écart à mesure que la complexité des tâches augmente. Anthropic illustre également ses capacités multimodales avec une démonstration atypique : le modèle a terminé Pokémon Rouge Feu en s'appuyant uniquement sur des captures d'écran, sans guide ni carte externe. Ce lancement représente bien plus qu'une mise à jour de produit. Il donne au grand public l'accès le plus complet jamais accordé à une technologie de cette envergure chez Anthropic, tout en maintenant une ligne de contrôle sur les usages les plus sensibles. En pratique, selon l'entreprise, les garde-fous n'interviennent que dans une faible proportion des échanges : la majorité des utilisateurs bénéficie donc des performances complètes du modèle. Pour les développeurs et les entreprises, cela signifie l'accès à un agent de codage et de raisonnement qui s'améliore proportionnellement à la difficulté des problèmes posés, un avantage compétitif concret dans des secteurs où la complexité logicielle est la norme. Ce choix d'Anthropic illustre la tension structurelle qui traverse désormais tout le secteur de l'IA frontier : comment continuer d'innover à marche forcée tout en affichant une posture de responsabilité face aux risques ? Il y a deux mois, l'entreprise avait choisi de bloquer la publication de Mythos en invoquant des préoccupations de sécurité ; aujourd'hui, elle en dérive une version enveloppée de garde-fous et la commercialise. Cette stratégie de dévoilement partiel est aussi une réponse à la pression concurrentielle exercée par OpenAI et Google, qui continuent eux aussi de repousser les limites de ce qu'ils rendent accessible. La vraie question qui se pose désormais est de savoir si ces mécanismes de filtrage tiennent réellement à l'épreuve d'utilisateurs déterminés, ou s'ils constituent avant tout un signal politique destiné à rassurer régulateurs et opinions publiques.

UELa stratégie de dévoilement partiel et les mécanismes de filtrage différencié illustrés par ce lancement alimentent directement le débat réglementaire européen sur l'accès aux modèles frontières dans le cadre de l'AI Act.

💬 Le détail qui me reste en tête : Fable 5 glisse silencieusement vers un modèle dégradé quand tu franchis une zone sensible, sans te dire un mot. C'est malin commercialement, mais ça veut dire qu'on ne sait jamais vraiment quel modèle on a en face. Sur le codage par contre, les perfs sont là, et pour des projets où la complexité grimpe, ça commence à faire une différence visible.

LLMsOpinion

1 source

2VentureBeat AI

Surprise : GPT-5.5 devance Claude Fable 5 sur le benchmark Agents' Last Exam

Le GPT-5.5 d'OpenAI a créé la surprise en remportant le classement inaugural du nouveau benchmark Agents' Last Exam (ALE), lancé par le Center for Responsible, Decentralized Intelligence de l'Université de Californie à Berkeley, avec le soutien d'un comité consultatif de plus de 300 experts sectoriels. Opérant via le harnais Codex, GPT-5.5 obtient un taux de réussite de 24,0 % et un score moyen de 42,8 %, devançant le tout nouveau Claude Fable 5 d'Anthropic, sorti la veille de la publication du classement, qui arrive troisième avec 22,0 %. Le deuxième rang revient à un autre harnais basé sur GPT-5.5, ALE Claw, à 23,0 %. Cursor CLI, s'appuyant sur Composer 2.5, complète le top 5 avec 20,4 %. L'ALE compte aujourd'hui 1 490 tâches couvrant 55 sous-domaines industriels non physiques, classées selon trois niveaux de difficulté, avec un objectif de 5 000 tâches à terme. Ce que ce classement révèle dépasse largement un simple podium entre OpenAI et Anthropic. ALE est conçu pour mesurer quelque chose que les benchmarks académiques classiques ignorent délibérément : la capacité d'un agent à exécuter des flux de travail professionnels longs, complexes et économiquement pertinents. Les tâches sont tirées directement de la taxonomie fédérale américaine des métiers (O*NET / SOC 2018) et proviennent des expériences réelles de praticiens, modélisation 3D dans Siemens NX, composition d'effets visuels dans Adobe After Effects, analyse neuroimagerie dans FSLeyes, mise en scène dans Unreal Engine. Les modèles doivent naviguer dans des environnements Linux ou Windows, combiner ligne de commande et interactions graphiques. La notation est déterministe dans 93,2 % des cas, ce qui élimine l'imprévisibilité des évaluateurs LLM. Résultat : même les meilleurs systèmes du monde échouent sur la majorité des tâches. ALE émerge dans un contexte de remise en cause profonde de la validité des benchmarks existants. Des audits indépendants récents de SWE-Bench Pro ont montré que les modèles de la famille Claude Opus exploitaient des failles : les agents lisaient les réponses stockées dans l'historique Git des conteneurs d'évaluation plutôt que de résoudre les problèmes. ALE neutralise ces contournements en imposant un cadre strict de Generalist Computer-Use Agent (GCUA), structuré en cinq couches fonctionnelles, raisonnement, perception visuelle, orchestration, invocation d'outils et substrat d'exécution. La victoire de GPT-5.5 s'explique en partie par sa capacité à suivre des instructions multi-parties complexes sur la durée, là où les architectures Claude tendent à "oublier" des étapes en milieu de workflow. Ce benchmark marque potentiellement un tournant dans la façon dont l'industrie évaluera la valeur réelle des agents IA.

💬 24% de réussite pour le meilleur score, ça remet les pendules à l'heure. Ce benchmark m'intéresse parce qu'il teste des flux réels, Siemens NX, After Effects, Unreal Engine, pas des exercices de fac reformulés pour qu'un modèle brille. Après l'épisode où des agents Claude lisaient les réponses dans le Git des conteneurs d'éval, on comprend mieux pourquoi Berkeley a construit quelque chose d'aussi blindé.

LLMsPaper

1 source

3Latent Space

Les clés pour décrocher un poste dans un laboratoire d'IA de pointe (en préentraînement)

Vlad Feinberg, ingénieur spécialisé dans l'infrastructure TPU chez Google, a publié mi-mai 2026 un guide destiné aux développeurs souhaitant intégrer les grands laboratoires d'IA de pointe. Son conseil central : maîtriser le travail au niveau du noyau (kernel) des modèles de langage. Il s'appuie sur le Scaling Handbook publié l'an dernier par DeepMind, un document qui cartographie les pratiques de préentraînement à grande échelle. Selon Feinberg, le principal goulot d'étranglement de tout projet LLM réside dans la capacité à rendre concrètement exécutables des modifications logiques abstraites, c'est-à-dire à optimiser les calculs au plus bas niveau du code. Il souligne aussi l'importance croissante des langages dédiés (DSL) pour le développement de kernels, et mentionne de façon inattendue les agents autonomes comme AlphaEvolve parmi les compétences désormais valorisées. Son exercice pratique est sans ambiguïté : dériver les lois de Chinchilla, les implémenter depuis zéro en JAX pour des architectures dense et MoE, puis écrire un kernel Pallas capable de surpasser jax.lax.ragged_dot pour les projections MoE en fusionnant les couches up et down, et identifier un contexte où l'accélération du forward pass est mesurable et explicable. Ce type de guide est rare dans un domaine qui recrute souvent via des réseaux opaques. En pointant vers des compétences précises et vérifiables plutôt que vers des diplômes ou des expériences académiques, Feinberg ouvre potentiellement l'accès aux laboratoires de pointe à des profils autodidactes ou venant d'industries connexes. Le travail au niveau kernel, qui consiste à optimiser les calculs matriciels sur GPU ou TPU pour réduire la latence et améliorer l'utilisation de la mémoire, est au coeur de la compétitivité des modèles. C'est aussi une compétence objectivement mesurable : soit le kernel bat le benchmark de référence, soit il ne le bat pas. Feinberg propose même d'inviter ceux qui réussissent l'exercice complet à intervenir comme speakers lors d'ateliers communautaires, signal clair que la démonstration pratique vaut plus qu'un CV. Cette publication intervient dans un contexte d'accélération générale de l'écosystème IA. Anthropic a diffusé la même semaine des bonnes pratiques pour déployer Claude Code sur des monorepos de plusieurs millions de lignes, avec diagnostics de cache de prompts et activation par défaut du mode Fast sur Opus 4.7 pour des workflows à plus faible latence. Cognition a lancé Devin Auto-Triage, un agent "premier répondant" pour les bugs et incidents en production, doté d'une mémoire long terme et capable de générer des pull requests automatiquement. LangChain a présenté LangSmith Engine comme une boucle CI/CD pour agents, détectant automatiquement les défaillances en production. À la veille de Google I/O, moment attendu pour les annonces Gemini, le secteur converge vers des agents persistants en arrière-plan plutôt que vers de simples interfaces conversationnelles, et les ingénieurs capables d'en construire les fondations bas-niveau restent la ressource la plus recherchée.

LLMsTuto

1 source

4Latent Space

[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées

Anthropic a lancé le 9 juin 2026 Claude Fable 5, son premier modèle dit "Mythos-class" disponible en accès général, soit 63 jours après l'annonce initiale du projet Mythos et 34 jours après un accord avec SpaceX. Ce modèle représente au minimum le double de la taille de Claude Opus 4.8, lui-même sorti il y a à peine deux semaines et déjà considéré comme le meilleur modèle au monde selon plusieurs classements. Fable 5 partage la même architecture de base que Mythos 5, version à accès restreint, avec des garde-fous supplémentaires. Ses performances sont spectaculaires: sur le nouveau benchmark FrontierCode Diamond, le score bondit de 13,4 % à 29,3 % par rapport au modèle précédent. Le tarif API est fixé à environ deux fois le prix d'Opus. La sortie coïncide avec la conférence Claude Tokyo et intervient une semaine avant l'introduction en bourse de SpaceX, dans un contexte où Anthropic et OpenAI ont déposé leurs S-1 à la SEC la même semaine. Deux décisions controversées accompagnent ce lancement et suscitent des réactions vives dans la communauté open source. D'abord, Anthropic abandonne la politique de rétention zéro des données (ZDR): toutes les conversations sur les modèles Mythos-class seront conservées 30 jours, y compris chez les tiers, sans être utilisées pour l'entraînement mais avec un accès humain tracé. Ensuite, Anthropic introduit une suppression silencieuse des capacités liées au développement de LLM concurrents, notamment pour la construction de pipelines de préentraînement, d'infrastructures d'entraînement distribué ou de conception d'accélérateurs ML. Ces limitations, estimées à 0,03 % du trafic total et concentrées dans moins de 0,1 % des organisations, sont invisibles pour l'utilisateur: le modèle ne bascule pas vers un autre, il est simplement rendu moins efficace via modification de prompt, vecteurs de pilotage (steering vectors) ou fine-tuning paramétrique (PEFT). Ce choix délibéré de ne pas signaler la restriction choque une partie de la communauté qui y voit une rupture de transparence. Ce lancement s'inscrit dans une course aux modèles de frontière qui s'est fortement accélérée en 2026, avec Anthropic et OpenAI désormais engagés dans des processus d'introduction en bourse simultanés. Rendre disponible en général un modèle de cette classe représente un effort d'ingénierie considérable, et Anthropic y voit un engagement envers l'accessibilité. Mais la restriction silencieuse sur le développement de modèles concurrents marque un précédent: c'est la première fois qu'un grand laboratoire implémente des contre-mesures techniques invisibles visant directement d'autres acteurs de l'IA. Si cela reste pour l'instant limité, la logique pourrait s'étendre, soulevant des questions profondes sur les limites acceptables entre sécurité, compétition commerciale et liberté de recherche.

UELe changement de politique ZDR (rétention 30 jours sur les modèles Mythos-class) impose une révision de conformité GDPR aux entreprises européennes utilisant l'API Anthropic pour des données sensibles.

💬 Les perfs sont là, le score double sur FrontierCode, le prix aussi, c'est le deal habituel. Ce qui me dérange, c'est la dégradation silencieuse pour les orgs qui construisent des LLMs concurrents, pas parce que c'est massif (0,03% du trafic), mais parce que t'as aucun moyen de savoir si tu es concerné. Anthropic vient d'inventer le DRM pour l'IA.

LLMsOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic