Aller au contenu principal
[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées
LLMsLatent Space7h

[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées

Résumé IASources croisées · 2Impact UETake éditorial
Source originale ↗·
Egalement couvert par :ZDNET AI
[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées
▶ Voir sur YouTube

Anthropic a lancé le 9 juin 2026 Claude Fable 5, son premier modèle dit "Mythos-class" disponible en accès général, soit 63 jours après l'annonce initiale du projet Mythos et 34 jours après un accord avec SpaceX. Ce modèle représente au minimum le double de la taille de Claude Opus 4.8, lui-même sorti il y a à peine deux semaines et déjà considéré comme le meilleur modèle au monde selon plusieurs classements. Fable 5 partage la même architecture de base que Mythos 5, version à accès restreint, avec des garde-fous supplémentaires. Ses performances sont spectaculaires: sur le nouveau benchmark FrontierCode Diamond, le score bondit de 13,4 % à 29,3 % par rapport au modèle précédent. Le tarif API est fixé à environ deux fois le prix d'Opus. La sortie coïncide avec la conférence Claude Tokyo et intervient une semaine avant l'introduction en bourse de SpaceX, dans un contexte où Anthropic et OpenAI ont déposé leurs S-1 à la SEC la même semaine.

Deux décisions controversées accompagnent ce lancement et suscitent des réactions vives dans la communauté open source. D'abord, Anthropic abandonne la politique de rétention zéro des données (ZDR): toutes les conversations sur les modèles Mythos-class seront conservées 30 jours, y compris chez les tiers, sans être utilisées pour l'entraînement mais avec un accès humain tracé. Ensuite, Anthropic introduit une suppression silencieuse des capacités liées au développement de LLM concurrents, notamment pour la construction de pipelines de préentraînement, d'infrastructures d'entraînement distribué ou de conception d'accélérateurs ML. Ces limitations, estimées à 0,03 % du trafic total et concentrées dans moins de 0,1 % des organisations, sont invisibles pour l'utilisateur: le modèle ne bascule pas vers un autre, il est simplement rendu moins efficace via modification de prompt, vecteurs de pilotage (steering vectors) ou fine-tuning paramétrique (PEFT). Ce choix délibéré de ne pas signaler la restriction choque une partie de la communauté qui y voit une rupture de transparence.

Ce lancement s'inscrit dans une course aux modèles de frontière qui s'est fortement accélérée en 2026, avec Anthropic et OpenAI désormais engagés dans des processus d'introduction en bourse simultanés. Rendre disponible en général un modèle de cette classe représente un effort d'ingénierie considérable, et Anthropic y voit un engagement envers l'accessibilité. Mais la restriction silencieuse sur le développement de modèles concurrents marque un précédent: c'est la première fois qu'un grand laboratoire implémente des contre-mesures techniques invisibles visant directement d'autres acteurs de l'IA. Si cela reste pour l'instant limité, la logique pourrait s'étendre, soulevant des questions profondes sur les limites acceptables entre sécurité, compétition commerciale et liberté de recherche.

Impact France/UE

Le changement de politique ZDR (rétention 30 jours sur les modèles Mythos-class) impose une révision de conformité GDPR aux entreprises européennes utilisant l'API Anthropic pour des données sensibles.

💬 Le point de vue du dev

Les perfs sont là, le score double sur FrontierCode, le prix aussi, c'est le deal habituel. Ce qui me dérange, c'est la dégradation silencieuse pour les orgs qui construisent des LLMs concurrents, pas parce que c'est massif (0,03% du trafic), mais parce que t'as aucun moyen de savoir si tu es concerné. Anthropic vient d'inventer le DRM pour l'IA.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Anthropic lance Claude Fable 5 et Mythos 5, avec des progrès majeurs en programmation et en science
1The Decoder 

Anthropic lance Claude Fable 5 et Mythos 5, avec des progrès majeurs en programmation et en science

Anthropic a dévoilé deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Mythos 5, qui surpassent significativement la génération Opus actuelle, notamment en programmation et en recherche scientifique. Fable 5 s'est illustré de manière spectaculaire en réalisant en une seule journée une migration de code pour l'entreprise de paiements Stripe, une tâche qui aurait nécessité deux mois de travail à une équipe entière de développeurs. Mythos 5, de son côté, a démontré une capacité autonome à concevoir des candidats médicamenteux, mais reste pour l'instant inaccessible au public en raison de ses aptitudes jugées dangereuses en cybersécurité offensive. Ces deux modèles redéfinissent ce que l'on entend par agent autonome dans le secteur technologique. La performance de Fable 5 sur la migration Stripe représente un changement de paradigme pour les équipes d'ingénierie : des tâches autrefois réservées à des équipes entières pendant des semaines peuvent désormais être déléguées à un système IA en quelques heures, avec des implications directes sur les coûts et l'organisation du travail. Pour l'industrie pharmaceutique, les capacités de Mythos 5 ouvrent des perspectives considérables dans la découverte de médicaments, en accélérant des processus de recherche qui prennent habituellement des années. Ces annonces s'inscrivent dans une course intense entre les grands laboratoires d'IA, où Anthropic cherche à rivaliser avec OpenAI et Google DeepMind sur le terrain des modèles dits frontier. La décision de restreindre l'accès à Mythos 5 illustre une tension croissante entre la puissance des nouveaux modèles et les risques qu'ils engendrent : même leurs créateurs hésitent désormais à les rendre publics. Cette prudence d'Anthropic, laboratoire historiquement centré sur la sécurité, signale que les capacités des modèles les plus avancés franchissent des seuils préoccupants, et que la question de leur déploiement responsable va s'imposer comme enjeu central de l'industrie dans les mois à venir.

UELes équipes tech européennes peuvent dès maintenant tester Fable 5 pour automatiser des tâches d'ingénierie complexes, tandis que la restriction de Mythos 5 pour risques cybersécurité offensifs va alimenter les débats européens sur l'AI Act et l'encadrement des modèles frontier.

💬 La migration Stripe en une journée, bon, faut voir ce que donne le code en prod. Mais Mythos 5 bloqué par Anthropic eux-mêmes pour risques cyber offensifs, c'est le vrai signal : on a franchi un seuil que même ses créateurs ne savent plus comment tenir. Reste à voir combien de temps cette prudence va durer.

LLMsOpinion
1 source
Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour
2VentureBeat AI 

Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour

Anthropic a lancé le 9 juin 2026 deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Claude Mythos 5, marquant la première mise à disposition grand public de capacités dites "Mythos-class" jusqu'alors réservées aux partenaires du programme restreint Project Glasswing, annoncé deux mois plus tôt. Claude Fable 5 constitue la version accessible au grand public et surpasse tous les modèles Claude précédemment disponibles sur des tâches de développement logiciel, de travail intellectuel, de vision, de recherche scientifique et de longues séquences d'actions autonomes. Claude Mythos 5, lui, est une version améliorée du Mythos Preview, accessible uniquement aux partenaires cybersécurité de Project Glasswing et à une sélection de chercheurs en biologie. Les deux modèles sont facturés 10 dollars par million de tokens en entrée et 50 dollars par million en sortie, soit moins de la moitié du prix du Mythos Preview, mais ils demeurent les modèles les plus chers parmi les grands acteurs mondiaux de l'IA. Ce lancement introduit une architecture de sécurité inédite pour rendre les capacités Mythos accessibles sans les risques associés. Pour les requêtes jugées sensibles, notamment en cybersécurité, biologie, chimie ou distillation de modèles, Fable 5 redirige automatiquement vers Claude Opus 4.8 en notifiant l'utilisateur. Anthropic indique que plus de 95% des sessions Fable s'exécutent entièrement sur le modèle Fable sans ce repli, et que plus de 1 000 heures de tests adversariaux internes et externes n'ont révélé aucun contournement universel. Pour les développeurs, Fable 5 est disponible via l'API sous l'identifiant claude-fable-5 et sur les plans Enterprise à la consommation. Les abonnés Pro, Max, Team et Enterprise bénéficient d'un accès gratuit jusqu'au 22 juin 2026, date à laquelle le modèle basculera sur un système de crédits d'utilisation, Anthropic promettant de le réintégrer le plus vite possible dans les abonnements standards. Ce lancement s'inscrit dans une course aux capacités avancées qui divise désormais clairement le marché entre modèles grand public et modèles réservés à des usages à risque élevé. Anthropic avait ouvert Project Glasswing il y a deux mois pour permettre à des partenaires triés sur le volet d'accéder à des capacités cybersécurité offensives sous contrôle strict, une approche qui fait débat dans le secteur. Avec Fable 5, la société tente de commercialiser ces capacités à grande échelle tout en maintenant des garde-fous techniques. La concurrence est intense: DeepSeek, Google Gemini, xAI Grok et OpenAI GPT-5 couvrent désormais un spectre de prix allant de 0,42 à 35 dollars pour l'entrée et la sortie combinées, rendant le positionnement tarifaire d'Anthropic à 60 dollars le million de tokens cumulés difficile à justifier sans performances nettement supérieures sur les benchmarks les plus exigeants.

UELes développeurs et entreprises européens peuvent accéder à Claude Fable 5 via l'API dès maintenant, avec un accès gratuit jusqu'au 22 juin 2026 pour les abonnés payants, avant un basculement vers un système de crédits dont le tarif élevé (60 $ par million de tokens cumulés) pourrait freiner l'adoption au sein des startups et PME du continent.

💬 Le mécanisme de bascule automatique vers Opus pour les requêtes sensibles, c'est plus malin qu'un simple blocage, et c'est là la vraie nouveauté du lancement. Les benchmarks, on verra. Reste le prix : 60 dollars le million de tokens quand la moitié du marché est sous 5 dollars, c'est soit de la confiance assumée, soit un tarif qu'ils vont devoir revoir dans 6 mois.

LLMsOpinion
1 source
Avec Opus 4.8, Claude apprend à dire « je ne sais pas »
3Next INpact 

Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

Anthropic a lancé Opus 4.8 le 29 mai 2026, soit seulement quarante jours après la sortie d'Opus 4.7, confirmant un rythme de publication particulièrement soutenu pour son modèle le plus avancé. Le nouveau modèle introduit plusieurs améliorations ciblées : une meilleure gestion de l'incertitude, une fonction expérimentale baptisée "dynamic workflows" pour Claude Code, et un ajustement significatif du coût du mode rapide. Sur les benchmarks, les gains restent incrémentaux mais cohérents : +4,9 points sur SWE-Bench Pro et +8,5 points sur Terminal-Bench. Opus 4.8 s'impose nettement devant GPT-5.5 et Gemini 3.1 Pro sur les tâches d'agents de programmation, même si le modèle d'OpenAI conserve l'avantage sur Terminal-Bench. En mode rapide, la tarification a été divisée par trois : 10 dollars par million de tokens en entrée et 50 dollars en sortie, contre 30 et 150 dollars sur Opus 4.7, pour un traitement 2,5 fois plus rapide. Le changement le plus notable d'Opus 4.8 est comportemental : le modèle signale désormais plus facilement ses incertitudes, évite les affirmations non vérifiées et serait environ quatre fois moins susceptible de laisser passer des bugs sans les mentionner. Pour les équipes de développement qui utilisent Claude Code en production, c'est un gain de fiabilité concret. La fonction "dynamic workflows" pousse plus loin cette logique : face à de très grands projets logiciels, le modèle peut les découper automatiquement, lancer des centaines de sous-agents en parallèle et vérifier les résultats avant de répondre. Anthropic cite en exemple des migrations de bases de code contenant des centaines de milliers de lignes, un type de tâche où les hallucinations silencieuses et les bugs non détectés coûtent cher. Anthropic répond ici à une critique précise qui avait accompagné le lancement d'Opus 4.7 : sa consommation élevée de tokens, jugée excessive par de nombreux utilisateurs de Claude Code. En introduisant un curseur d'effort ajustable dans claude.ai et Cowork, la startup permet à l'utilisateur de choisir le niveau de ressources allouées à chaque requête, du mode économique au mode haute précision. Par défaut, Opus 4.8 reste réglé sur un effort élevé, censé offrir le meilleur équilibre entre qualité et vitesse, mais avec une consommation équivalente à Opus 4.7 pour de meilleures performances. Cette évolution s'inscrit dans une stratégie commerciale clairement orientée vers les développeurs et les entreprises, où la fiabilité des agents autonomes et la maîtrise des coûts d'inférence sont devenus des critères d'achat aussi importants que les scores aux benchmarks.

UELa division par trois du tarif du mode rapide rend Opus 4.8 plus accessible aux équipes de développement européennes qui utilisent l'API Claude en production.

💬 Le prix divisé par trois en mode rapide, ça va enfin débloquer des équipes qui hésitaient sur les budgets API. Le changement le plus utile reste comportemental : un modèle qui te dit qu'il n'est pas sûr plutôt que de t'inventer une réponse confiante dans une migration de cent mille lignes, c'est exactement ce qui manquait pour lâcher les rênes en prod. Quarante jours entre deux Opus.

LLMsOpinion
1 source
Faire tourner les modèles de raisonnement Qwen3.5 distillés façon Claude en GGUF avec quantification 4 bits
4MarkTechPost 

Faire tourner les modèles de raisonnement Qwen3.5 distillés façon Claude en GGUF avec quantification 4 bits

Des développeurs ont publié un tutoriel détaillé expliquant comment déployer les modèles Qwen3.5 distillés avec le style de raisonnement de Claude — notamment les variantes 27B en format GGUF et 2B en quantification 4 bits — directement dans Google Colab. Le pipeline proposé permet de basculer entre les deux variantes via un simple indicateur booléen, offrant ainsi une flexibilité rare entre puissance de raisonnement et contraintes matérielles. Le modèle 27B, hébergé sur Hugging Face sous l'identifiant Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF, pèse environ 16,5 Go une fois compressé en Q4KM, tandis que la version 2B s'appuie sur les librairies transformers et bitsandbytes pour une empreinte mémoire bien plus légère. Les deux chemins d'exécution sont unifiés derrière des interfaces communes generatefn et streamfn, auxquelles s'ajoute une classe ChatSession gérant les conversations multi-tours et un parseur de traces ` pour séparer explicitement le raisonnement intermédiaire de la réponse finale. Ce type d'implémentation ouvre concrètement l'accès à des modèles de raisonnement avancés à des développeurs qui ne disposent pas d'infrastructure dédiée. La quantification 4 bits permet de faire tourner un modèle de 27 milliards de paramètres sur un simple GPU T4 de Colab, ce qui était inaccessible il y a encore deux ans. La possibilité d'inspecter les traces de raisonnement — les chaînes de pensée encapsulées dans les balises ` — est particulièrement précieuse pour le débogage, l'évaluation et la recherche sur les comportements des LLM. Pour les équipes souhaitant intégrer du raisonnement structuré dans leurs applications sans dépendre d'API propriétaires, cette approche locale représente une alternative sérieuse. Ce tutoriel s'inscrit dans une tendance de fond : la distillation de comportements propres aux grands modèles commerciaux vers des modèles open source plus petits et autonomes. Qwen3.5, développé par Alibaba, fait partie des modèles open weight les plus performants du moment, et sa distillation avec le style de raisonnement de Claude 4.6 Opus illustre comment les techniques d'entraînement des laboratoires de pointe — Anthropic en tête — se diffusent rapidement dans l'écosystème ouvert. La quantification GGUF via llama.cpp, couplée aux outils Hugging Face, est désormais la voie standard pour démocratiser ces modèles. La prochaine étape naturelle sera l'intégration de ces pipelines dans des agents autonomes capables de raisonner en plusieurs étapes sur des tâches complexes, sans appel à des services cloud.

LLMsTuto
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour