LLMsBen's Bites3h· 3 min de lecture

Fable is back

Fable 5 est de nouveau accessible à tous les utilisateurs payants de Claude, quelques semaines après avoir été retiré. Anthropic évoque, dans un billet de blog, des garde-fous renforcés pour cette nouvelle version, même si l'auteur de la newsletter Ben's Bites affirme n'en avoir rencontré aucun pour l'instant. Le modèle reste toutefois disponible uniquement jusqu'au 7 juillet dans les formules d'abonnement, avec un quota d'usage limité à 50% du volume habituel. Un benchmark cité dans l'article affirme que Fable peut mener à bien 16% des tâches de travail à distance testées, soit le double d'Opus 4.8. Juste avant ce retour, Anthropic avait aussi lancé Claude Sonnet 5, dont les performances sur les tâches d'agents se rapprochent d'Opus 4.8 tout en coûtant moins cher au token. Il devient le modèle par défaut pour les offres gratuite et Pro, disponible dans Claude Code et via l'API, avec un tarif de lancement de 2 dollars par million de tokens en entrée et 10 dollars en sortie, valable jusqu'au 31 août. Côté Google, deux nouveaux modèles multimédias, Nano Banana 2 Lite et Gemini Omni Flash, sont désormais accessibles dans l'application Gemini et via l'API: le premier génère des images en moins de quatre secondes, à raison d'environ trente images en résolution 1K pour un dollar, tandis que le second permet de créer et modifier des vidéos pour 0,10 dollar la seconde. Par ailleurs, Bridgewater et Thinking Machines ont entraîné un modèle spécialisé atteignant 84,7% de précision sur des tâches de tri financier, pour un coût 13,8 fois inférieur au meilleur modèle généraliste testé. Enfin, Factory a affiné deux détecteurs dans son outil Droid Shield 2.0, capables de repérer des secrets exposés dans les sessions de code tout en réduisant les fausses alertes.

Cette avalanche d'annonces illustre à quel point la course entre laboratoires d'IA se joue désormais autant sur le coût et l'usage pratique que sur les scores bruts de benchmarks. Si Sonnet 5 affiche de bons résultats sur le papier, plusieurs utilisateurs, dont l'auteur de la newsletter, le jugent en pratique cher et lent, ce qui relativise l'intérêt de l'adopter par rapport à d'autres modèles. À l'inverse, l'exemple du modèle spécialisé de Bridgewater et Thinking Machines montre qu'un entraînement ciblé sur une tâche précise, comme le tri de dossiers financiers, peut surpasser un modèle généraliste frontière pour une fraction du coût, une piste que de plus en plus d'entreprises explorent pour maîtriser leurs dépenses en IA. Les nouveaux outils de génération d'images et de vidéos à bas coût de Google, eux, abaissent la barrière d'entrée pour les créateurs de contenu, tandis que le renforcement de la détection de secrets exposés chez Factory répond à une préoccupation croissante à mesure que les agents de code gèrent une part grandissante du travail des développeurs.

Ce mouvement s'inscrit dans une tendance plus large vers des agents capables d'agir de façon autonome, à condition de disposer du bon contexte et des bons outils. L'auteur illustre cela avec un exemple personnel: en vacances en Grèce, il a demandé à Codex de lui réserver un taxi pour rentrer de l'aéroport, et la tâche a été bouclée en un peu plus d'une minute et demie, l'agent ayant consulté son calendrier Google pour retrouver son vol, puis ses e-mails pour identifier son adresse et la compagnie de taxi utilisée à l'aller, avant de remplir le formulaire de réservation et de régler le trajet via un navigateur resté connecté. Cet exemple, bien que modeste, résume selon lui la logique qui sous-tend la plupart des usages efficaces des agents aujourd'hui: leur fournir la mémoire, les outils et le contexte nécessaires pour qu'ils puissent agir sans supervision constante, un principe qui devrait continuer à structurer le développement des futurs modèles et produits, qu'ils viennent d'Anthropic, de Google ou d'autres laboratoires concurrents.

Dans nos dossiers

Claude Fable 5 Anthropic Claude Opus Gemini

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Latent Space

Sonnet 5 aujourd'hui, Fable 5 demain

Voici l'article traduit et résumé selon le format demandé : Anthropic a lancé le 29 juin 2026 Claude Sonnet 5, son nouveau modèle de milieu de gamme par défaut, avec un déploiement immédiat sur l'application Claude, Claude Code, l'API et chez ses partenaires écosystème. L'entreprise le présente comme « son Sonnet le plus agentique à ce jour », capable de planifier des tâches, d'utiliser un navigateur ou un terminal et d'exécuter des actions de façon autonome à un niveau qui nécessitait auparavant des modèles plus volumineux et plus coûteux. Le modèle dispose d'une fenêtre de contexte d'un million de tokens et devient le choix par défaut dans Claude Code pour les utilisateurs Pro. Côté tarifs, Anthropic maintient son prix catalogue à 3 dollars par million de tokens en entrée et 15 dollars en sortie, mais propose un tarif promotionnel à 2 dollars et 10 dollars jusqu'au 31 août ou 1er septembre selon les sources. Le lancement s'accompagne de l'arrivée de Claude Desktop sur Linux, en version bêta pour Ubuntu et Debian, incluant Claude Code, Cowork et le chat pour les comptes payants, mais sans la fonctionnalité Computer Use. Anthropic a aussi mis à jour ses Managed Agents avec des flux de données par session, des dérogations par session, des événements webhook, une pagination inversée, un contrôle plus fin de l'injection d'identifiants et un nouvel onglet d'observabilité pour suivre l'usage de tokens et d'outils. Cette mise à jour repositionne Sonnet comme une alternative crédible aux modèles haut de gamme pour les tâches de codage et d'automatisation, à un tarif nettement inférieur. Pour les développeurs et les entreprises utilisant Claude Code ou l'API, cela signifie un accès à des capacités agentiques avancées, comme l'exécution autonome de tâches complexes, sans payer le prix d'un modèle premium. L'arrivée sur Linux et les nouveaux outils de supervision des agents renforcent également l'attrait de la plateforme pour les équipes techniques qui déploient des agents IA en production. Ce lancement intervient après plusieurs semaines de rumeurs intenses autour d'une sortie conjointe de Sonnet 5 et de Fable 5, un modèle plus puissant que beaucoup attendaient depuis son interdiction survenue dix-huit jours plus tôt à la suite d'un différend avec les autorités. Des indices avaient suggéré qu'Anthropic préparait pour Fable 5 un système de crédits d'usage séparé, facturé hors des abonnements existants, avec des exigences de vérification d'identité, ce qui avait fait craindre un accès restreint, notamment en Europe. Sonnet 5 est finalement arrivé seul, laissant l'absence de Fable 5 comme le véritable sujet de discussion parmi les utilisateurs, alors que son retour, annoncé après un travail avec les pouvoirs publics, reste attendu.

UELe systeme de credits envisage pour Fable 5, avec verification d'identite, faisait craindre un acces restreint pour les utilisateurs europeens, meme si Sonnet 5 reste disponible normalement en France et dans l'UE.

💬 Sonnet 5 arrive seul et c'est peut-être le signal le plus intéressant de la semaine : Anthropic sort son modèle "agentique par défaut" à un tarif cassé, mais laisse Fable 5 dans les limbes après son interdiction. Un million de tokens de contexte et des capacités d'agent qui nécessitaient hier des modèles trois fois plus chers, ça change la donne pour tous ceux qui tournent sur Claude Code au quotidien. Reste que le vrai sujet, c'est l'absence de Fable 5 : si Anthropic prépare un système de crédits séparé avec vérification d'identité pour son modèle le plus puissant, l'accès en Europe risque d'être le premier à en payer le prix.

LLMsActu

1 source

2Latent Space

[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées

Anthropic a lancé le 9 juin 2026 Claude Fable 5, son premier modèle dit "Mythos-class" disponible en accès général, soit 63 jours après l'annonce initiale du projet Mythos et 34 jours après un accord avec SpaceX. Ce modèle représente au minimum le double de la taille de Claude Opus 4.8, lui-même sorti il y a à peine deux semaines et déjà considéré comme le meilleur modèle au monde selon plusieurs classements. Fable 5 partage la même architecture de base que Mythos 5, version à accès restreint, avec des garde-fous supplémentaires. Ses performances sont spectaculaires: sur le nouveau benchmark FrontierCode Diamond, le score bondit de 13,4 % à 29,3 % par rapport au modèle précédent. Le tarif API est fixé à environ deux fois le prix d'Opus. La sortie coïncide avec la conférence Claude Tokyo et intervient une semaine avant l'introduction en bourse de SpaceX, dans un contexte où Anthropic et OpenAI ont déposé leurs S-1 à la SEC la même semaine. Deux décisions controversées accompagnent ce lancement et suscitent des réactions vives dans la communauté open source. D'abord, Anthropic abandonne la politique de rétention zéro des données (ZDR): toutes les conversations sur les modèles Mythos-class seront conservées 30 jours, y compris chez les tiers, sans être utilisées pour l'entraînement mais avec un accès humain tracé. Ensuite, Anthropic introduit une suppression silencieuse des capacités liées au développement de LLM concurrents, notamment pour la construction de pipelines de préentraînement, d'infrastructures d'entraînement distribué ou de conception d'accélérateurs ML. Ces limitations, estimées à 0,03 % du trafic total et concentrées dans moins de 0,1 % des organisations, sont invisibles pour l'utilisateur: le modèle ne bascule pas vers un autre, il est simplement rendu moins efficace via modification de prompt, vecteurs de pilotage (steering vectors) ou fine-tuning paramétrique (PEFT). Ce choix délibéré de ne pas signaler la restriction choque une partie de la communauté qui y voit une rupture de transparence. Ce lancement s'inscrit dans une course aux modèles de frontière qui s'est fortement accélérée en 2026, avec Anthropic et OpenAI désormais engagés dans des processus d'introduction en bourse simultanés. Rendre disponible en général un modèle de cette classe représente un effort d'ingénierie considérable, et Anthropic y voit un engagement envers l'accessibilité. Mais la restriction silencieuse sur le développement de modèles concurrents marque un précédent: c'est la première fois qu'un grand laboratoire implémente des contre-mesures techniques invisibles visant directement d'autres acteurs de l'IA. Si cela reste pour l'instant limité, la logique pourrait s'étendre, soulevant des questions profondes sur les limites acceptables entre sécurité, compétition commerciale et liberté de recherche.

UELe changement de politique ZDR (rétention 30 jours sur les modèles Mythos-class) impose une révision de conformité GDPR aux entreprises européennes utilisant l'API Anthropic pour des données sensibles.

💬 Les perfs sont là, le score double sur FrontierCode, le prix aussi, c'est le deal habituel. Ce qui me dérange, c'est la dégradation silencieuse pour les orgs qui construisent des LLMs concurrents, pas parce que c'est massif (0,03% du trafic), mais parce que t'as aucun moyen de savoir si tu es concerné. Anthropic vient d'inventer le DRM pour l'IA.

LLMsOpinion

1 source

3Le Big Data

Fable 5 bloqué : la Chine lance GLM-5.2, une solution open source

Le 16 juin 2026, l'entreprise chinoise Zhipu a lancé GLM-5.2, un modèle d'intelligence artificielle en accès libre ciblant directement les tâches de programmation agentique et de raisonnement complexe. Disponible sur Ollama et Hugging Face sous licence MIT, le modèle embarque une fenêtre de contexte d'un million de jetons et propose deux niveaux de raisonnement : un mode "Max" orienté performances maximales et un mode "High" offrant un meilleur équilibre entre puissance et consommation. Sur les benchmarks publiés par Zhipu, GLM-5.2 affiche 81,0 % sur Terminal-Bench, 62,1 % sur SWE-bench Pro et 74,4 % sur Frontier SWE. Sur Design Arena, il décroche la première place avec un score Elo de 1360, devançant Claude Fable 5, et se classe deuxième sur Code Arena Frontend. Le lancement intervient au moment précis où Anthropic a suspendu l'accès à Claude Fable 5, offrant à GLM-5.2 une fenêtre de visibilité rare sur le marché. Pour les développeurs, l'enjeu est concret : la publication des poids sous licence MIT permet d'exécuter le modèle localement, de l'adapter à des cas d'usage spécifiques et de l'intégrer dans des pipelines sans dépendance à une API commerciale. Une fenêtre de contexte à un million de jetons combinée à de solides résultats sur les benchmarks de correction de bugs réels et de génération d'interfaces ouvre des perspectives directes pour l'automatisation du développement logiciel, la recherche assistée et les agents autonomes de longue durée. Il faut toutefois nuancer l'étiquette "open source" : si les poids du modèle sont bien publiés, les données d'entraînement, les pipelines de filtrage et le code complet ayant servi à l'entraîner restent privés. GLM-5.2 est donc plus précisément un modèle "open weight", une distinction qui compte pour les chercheurs et les équipes de sécurité souhaitant auditer ou reproduire le système. Par ailleurs, les chiffres de performance avancés par Zhipu n'ont pas encore été confirmés par des évaluations indépendantes. Ce lancement s'inscrit dans une tendance plus large : les laboratoires chinois, portés par des investissements massifs et l'urgence stratégique de contourner les restrictions américaines sur les semi-conducteurs, enchaînent les sorties de modèles compétitifs à un rythme soutenu. GLM-5.2 vient directement concurrencer les modèles de code occidentaux au moment où le leader de facto du secteur est temporairement indisponible.

UELes développeurs européens peuvent déployer GLM-5.2 localement via Ollama et Hugging Face sous licence MIT, offrant une alternative concrète aux modèles fermés pour les pipelines d'automatisation de code et les agents autonomes.

💬 Timing parfait pour Zhipu. Un modèle MIT avec 1M de contexte qui sort exactement quand Fable 5 est en pause forcée, c'est soit du hasard soit un calendrier très bien travaillé. Les benchmarks sont auto-publiés et "open weight" n'est pas "open source" (les données d'entraînement restent privées), mais pour faire tourner ça en local sans dépendance à une API commerciale, c'est du concret.

LLMsOpinion

1 source

4AI News

Anthropic déploie Claude Sonnet 5, restaure Fable et Mythos

Anthropic a officiellement levé la suspension de ses modèles les plus avancés, Fable et Mythos, et lancé Claude Sonnet 5, mettant fin à dix-huit jours de blocage imposé par une directive fédérale américaine sur le contrôle des exportations entrée en vigueur le 12 juin. La suspension avait été déclenchée après que des chercheurs d'Amazon eurent documenté une méthode permettant de contourner les garde-fous de sécurité de Fable 5, la poussant à identifier des failles logicielles et à produire du code d'exploitation. Faute de système de vérification de nationalité en temps réel, les autorités avaient exigé un blocage total de l'accès pour l'ensemble des utilisateurs dans le monde. Des évaluations menées pendant l'interruption ont montré que ce comportement n'était pas propre à Fable 5 : des architectures plus anciennes et moins puissantes, dont Claude Opus 4.8, GPT-5.5 et Kimi K2.7, reproduisaient exactement les mêmes résultats. Pour répondre à l'exigence fédérale, les ingénieurs d'Anthropic ont entraîné un nouveau classificateur de sécurité ciblant précisément la faille signalée par Amazon, avec un taux de blocage supérieur à 99 % lors des tests internes. Ce correctif ouvre la voie à un déploiement commercial complet sur la plateforme, l'infrastructure cloud et les réseaux partenaires d'Anthropic, mais il introduit un compromis pour les équipes de développement. Le nouveau classificateur, volontairement large dans sa marge de sécurité, signale plus fréquemment des requêtes bénignes lors de tâches courantes de développement ou de débogage. Lorsqu'une invite déclenche ce filtre, la charge de travail est automatiquement redirigée vers l'ancienne architecture Opus 4.8 pour assurer la continuité du service. Le vrai enjeu commercial se concentre toutefois sur Claude Sonnet 5, que de nombreuses équipes techniques adoptent pour leurs agents autonomes afin de réduire les coûts tout en conservant une forte capacité d'exécution. Sur les benchmarks SWE-bench Pro et Terminal-Bench 2.1, Sonnet 5 atteint respectivement 63,2 % et 80,4 %, contre 58,1 % et 67 % pour Sonnet 4.6, pour un prix inchangé de 3 dollars par million de tokens en entrée et 15 dollars en sortie, avec un tarif de lancement réduit à 2 et 10 dollars jusqu'au 31 août 2026. Plusieurs entreprises ont déjà déployé le modèle en production. Chez Rakuten, les équipes techniques l'ont utilisé pour traiter des dizaines de pull requests parmi les plus complexes, le système exécutant et vérifiant lui-même les tests avant validation humaine finale. Zapier l'a intégré à ses flux de travail pour automatiser des tâches administratives à plusieurs étapes, comme la mise à jour de comptes Salesforce suivie de l'envoi d'annonces de lancement à des clients entreprise, une séquence que les versions précédentes du modèle peinaient souvent à mener à terme sans intervention humaine. L'éditeur d'outils de développement Zed a de son côté utilisé le modèle pour automatiser des procédures de débogage complexes. Cet épisode illustre la pression réglementaire croissante qui pèse sur les systèmes d'intelligence artificielle les plus avancés, à mesure que leurs capacités techniques se rapprochent de zones jugées sensibles par les gouvernements.

UELe blocage mondial ayant aussi affecté les utilisateurs europeens de la plateforme Anthropic, la levée de la suspension et le déploiement de Claude Sonnet 5 profitent indirectement aux entreprises et développeurs francais et europeens, sans qu'aucune entité francaise ou europeenne ne soit directement citée.

💬 Dix-huit jours de blocage total pour une faille qui touchait en fait tous les modèles du marché, Opus comme GPT-5.5, c'est le signe que la régulation avance plus vite que les garde-fous techniques. Le classificateur bricolé en urgence, qui balance les requêtes de dev vers l'ancien Opus dès qu'il a un doute, ça reste un pansement, pas une solution. Sur le papier Sonnet 5 est solide, 63% sur SWE-bench Pro c'est du concret, mais l'épisode Amazon prouve qu'un modèle capable de trouver des failles logicielles finira toujours par attirer l'œil des régulateurs avant celui des développeurs.

LLMsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic