Anthropic frappe fort : Claude Opus 4.8 écrase…

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos

53

1VentureBeat AI

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos

Anthropic a lancé le 28 mai 2026 Claude Opus 4.8, une mise à jour de son modèle phare, disponible immédiatement sur claude.ai, Claude Code, l'API et Cowork. La tarification standard reste inchangée par rapport à Opus 4.7 : 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie. La grande nouveauté est le mode rapide ("fast mode"), qui génère les tokens à environ 2,5 fois la vitesse normale et voit son prix chuter à 10 dollars par million de tokens en entrée et 50 dollars en sortie, soit une réduction de trois fois par rapport aux 30/150 dollars du mode rapide d'Opus 4.7. Sur les benchmarks, les progrès sont réels mais modestes : 88,6 % sur SWE-bench Verified (contre 87,6 % pour Opus 4.7), 69,2 % sur SWE-bench Pro (contre 64,3 %) et 74,6 % sur Terminal-Bench 2.1 (contre 66,1 %). Opus 4.8 surpasse également GPT-5.5 d'OpenAI sur au moins 12 benchmarks, notamment en raisonnement, en codage et en utilisation d'outils agentiques. Cette baisse tarifaire sur le mode rapide est significative pour l'industrie : elle rend l'inférence à haut débit accessible aux applications de production sensibles à la latence, un segment jusqu'ici réservé aux modèles moins puissants. Databricks a rapporté une réduction de 61 % du coût en tokens par rapport à Opus 4.7, grâce à une meilleure efficacité multimodale sur les PDF et diagrammes. La startup Cognition, éditrice de Devin, confirme que le modèle corrige des problèmes de verbosité et d'appels d'outils présents dans Opus 4.7. Un fournisseur spécialisé en computer-use a atteint 84 % sur le benchmark Online-Mind2Web, dépassant à la fois Opus 4.7 et GPT-5.5. Anthropic introduit également en préversion les "dynamic workflows" dans Claude Code, permettant de lancer des centaines de sous-agents en parallèle pour des tâches dépassant la capacité d'une seule fenêtre de contexte. Opus 4.8 s'inscrit dans une trajectoire d'accélération chez Anthropic, qui positionne ce modèle entre Opus 4.7 et Claude Mythos Preview, un modèle plus puissant actuellement limité à un petit nombre d'organisations dans le cadre du Project Glasswing, dédié à la cybersécurité. Anthropic a annoncé vouloir mettre des "modèles de classe Mythos" à la disposition de l'ensemble de ses clients dans les prochaines semaines, une fois des garde-fous cyber supplémentaires en place. La course au sommet se joue désormais sur plusieurs fronts simultanément : la puissance brute, le coût d'inférence et les capacités agentiques, trois axes où OpenAI, Google et les acteurs chinois comme DeepSeek ou Alibaba exercent une pression croissante sur Anthropic.

UELa réduction tarifaire du mode rapide (3x moins cher) rend l'inférence haute performance directement accessible aux développeurs et entreprises européens qui déploient des LLMs en production.

💬 Le vrai truc, c'est pas les benchmarks (modestes, clairement), c'est le fast mode à 10 dollars le million de tokens, trois fois moins cher qu'Opus 4.7 : ça rend enfin l'inférence haute vitesse viable en prod sans sacrifier un modèle plus faible. Les dynamic workflows dans Claude Code, des centaines de sous-agents en parallèle, c'est le genre de truc qu'on attendait depuis 2 ans. Et Mythos pour tout le monde dans les semaines qui viennent, bon, sur le papier c'est prometteur.

LLMsActu

1 source

Anthropic déploie Claude Sonnet 5, restaure Fable et Mythos

51

2AI News

Anthropic déploie Claude Sonnet 5, restaure Fable et Mythos

Anthropic a officiellement levé la suspension de ses modèles les plus avancés, Fable et Mythos, et lancé Claude Sonnet 5, mettant fin à dix-huit jours de blocage imposé par une directive fédérale américaine sur le contrôle des exportations entrée en vigueur le 12 juin. La suspension avait été déclenchée après que des chercheurs d'Amazon eurent documenté une méthode permettant de contourner les garde-fous de sécurité de Fable 5, la poussant à identifier des failles logicielles et à produire du code d'exploitation. Faute de système de vérification de nationalité en temps réel, les autorités avaient exigé un blocage total de l'accès pour l'ensemble des utilisateurs dans le monde. Des évaluations menées pendant l'interruption ont montré que ce comportement n'était pas propre à Fable 5 : des architectures plus anciennes et moins puissantes, dont Claude Opus 4.8, GPT-5.5 et Kimi K2.7, reproduisaient exactement les mêmes résultats. Pour répondre à l'exigence fédérale, les ingénieurs d'Anthropic ont entraîné un nouveau classificateur de sécurité ciblant précisément la faille signalée par Amazon, avec un taux de blocage supérieur à 99 % lors des tests internes. Ce correctif ouvre la voie à un déploiement commercial complet sur la plateforme, l'infrastructure cloud et les réseaux partenaires d'Anthropic, mais il introduit un compromis pour les équipes de développement. Le nouveau classificateur, volontairement large dans sa marge de sécurité, signale plus fréquemment des requêtes bénignes lors de tâches courantes de développement ou de débogage. Lorsqu'une invite déclenche ce filtre, la charge de travail est automatiquement redirigée vers l'ancienne architecture Opus 4.8 pour assurer la continuité du service. Le vrai enjeu commercial se concentre toutefois sur Claude Sonnet 5, que de nombreuses équipes techniques adoptent pour leurs agents autonomes afin de réduire les coûts tout en conservant une forte capacité d'exécution. Sur les benchmarks SWE-bench Pro et Terminal-Bench 2.1, Sonnet 5 atteint respectivement 63,2 % et 80,4 %, contre 58,1 % et 67 % pour Sonnet 4.6, pour un prix inchangé de 3 dollars par million de tokens en entrée et 15 dollars en sortie, avec un tarif de lancement réduit à 2 et 10 dollars jusqu'au 31 août 2026. Plusieurs entreprises ont déjà déployé le modèle en production. Chez Rakuten, les équipes techniques l'ont utilisé pour traiter des dizaines de pull requests parmi les plus complexes, le système exécutant et vérifiant lui-même les tests avant validation humaine finale. Zapier l'a intégré à ses flux de travail pour automatiser des tâches administratives à plusieurs étapes, comme la mise à jour de comptes Salesforce suivie de l'envoi d'annonces de lancement à des clients entreprise, une séquence que les versions précédentes du modèle peinaient souvent à mener à terme sans intervention humaine. L'éditeur d'outils de développement Zed a de son côté utilisé le modèle pour automatiser des procédures de débogage complexes. Cet épisode illustre la pression réglementaire croissante qui pèse sur les systèmes d'intelligence artificielle les plus avancés, à mesure que leurs capacités techniques se rapprochent de zones jugées sensibles par les gouvernements.

UELe blocage mondial ayant aussi affecté les utilisateurs europeens de la plateforme Anthropic, la levée de la suspension et le déploiement de Claude Sonnet 5 profitent indirectement aux entreprises et développeurs francais et europeens, sans qu'aucune entité francaise ou europeenne ne soit directement citée.

💬 Dix-huit jours de blocage total pour une faille qui touchait en fait tous les modèles du marché, Opus comme GPT-5.5, c'est le signe que la régulation avance plus vite que les garde-fous techniques. Le classificateur bricolé en urgence, qui balance les requêtes de dev vers l'ancien Opus dès qu'il a un doute, ça reste un pansement, pas une solution. Sur le papier Sonnet 5 est solide, 63% sur SWE-bench Pro c'est du concret, mais l'épisode Amazon prouve qu'un modèle capable de trouver des failles logicielles finira toujours par attirer l'œil des régulateurs avant celui des développeurs.

LLMsActu

1 source

Anthropic lance Claude Opus 4.8 : L’IA délivrée des hallucinations enfin arrivée ?

57

3Le Big Data

Anthropic lance Claude Opus 4.8 : L’IA délivrée des hallucinations enfin arrivée ?

Anthropic a lancé le 28 mai 2026 Claude Opus 4.8, la nouvelle version de son modèle phare, disponible immédiatement au même tarif que son prédécesseur Opus 4.7. Le modèle affiche des performances notables sur les benchmarks techniques : 69,2 % sur SWE-Bench Pro et 74,6 % sur Agentic Terminal Coding, des scores qui le placent devant GPT-5.5 d'OpenAI et Gemini 3.1 Pro de Google selon les comparatifs publiés par Anthropic. Dans Claude Code, l'entreprise introduit un système de flux de travail dynamiques capable de générer des scripts JavaScript pour orchestrer des centaines de sous-agents en parallèle. Un utilisateur a rapporté avoir réécrits 750 000 lignes de code en 11 jours grâce à ce système. Un mode rapide est également disponible via la commande /fast : même modèle, vitesse 2,5 fois supérieure, coût réduit de près des deux tiers. La principale promesse d'Opus 4.8 n'est pas spectaculaire mais potentiellement décisive : la fiabilité. Anthropic cible directement le problème des hallucinations et de la fausse confiance qui plombe l'adoption des IA en contexte professionnel. Le modèle serait désormais capable de reconnaître ses propres limites, de signaler ses incertitudes et d'identifier des incohérences dans ses propres analyses avant que l'utilisateur ne s'en aperçoive. Michael Ran de Bridgewater Associates, la plus grande société de gestion de fonds au monde, témoigne que Claude Opus 4.8 repère de lui-même certains problèmes dans les analyses produites, là où d'autres modèles laissaient passer les erreurs silencieusement. Anthropic affirme également avoir réduit les risques de comportements désalignés et amélioré la gestion des contenus sensibles. Opus 4.8 s'inscrit dans un cycle de publication accéléré chez Anthropic : Opus 4.7 n'avait été lancé que quelques semaines auparavant. L'entreprise prend soin de qualifier cette nouvelle version d'amélioration « modeste mais tangible », une prudence qui répond aux critiques adressées à Opus 4.7, accusé d'une réflexion adaptative mal calibrée, trop de temps sur les tâches simples, trop peu sur les complexes. Pour corriger ce défaut, Anthropic introduit un panneau de contrôle de l'effort permettant aux utilisateurs d'ajuster le niveau de réflexion du modèle selon la nature de la tâche. La course à la fiabilité devient ainsi le nouveau front concurrentiel entre les grands laboratoires, après la course aux paramètres et aux benchmarks bruts qui a dominé les deux dernières années.

💬 La promesse anti-hallucinations, c'est l'angle qui m'accroche ici, pas les benchmarks SWE. Un modèle qui repère ses propres incohérences avant que tu t'en aperçoives, ça débloque l'adoption en contexte pro mieux que n'importe quel score sur un leaderboard. Le `/fast` à moins 65% de coût en prime, c'est du concret.

LLMsOpinion

1 source

Anthropic lance Claude Fable 5 et Claude Mythos 5 : même modèle de base, garde-fous distincts, nouvelle catégorie Mythos

48

4MarkTechPost

Anthropic lance Claude Fable 5 et Claude Mythos 5 : même modèle de base, garde-fous distincts, nouvelle catégorie Mythos

Le 9 juin 2026, Anthropic a lancé deux nouveaux modèles d'intelligence artificielle : Claude Fable 5 et Claude Mythos 5. Les deux appartiennent à une nouvelle catégorie baptisée "Mythos-class", positionnée au-dessus de la classe Opus dans la hiérarchie de l'entreprise. Fable 5 est la version grand public, dotée de classifieurs de sécurité complets. Mythos 5 est le même modèle de base, mais avec certains de ces classifieurs désactivés, disponible uniquement en accès restreint. Les deux prennent en charge une fenêtre de contexte d'un million de tokens par défaut, permettent jusqu'à 128 000 tokens en sortie par requête, et sont tarifés à 10 dollars par million de tokens en entrée et 50 dollars par million en sortie, soit moins de la moitié du prix de Claude Mythos Preview lancé en avril. Anthropic positionne Fable 5 comme son modèle le plus performant jamais rendu publiquement disponible, particulièrement adapté au raisonnement complexe et aux tâches agentiques longues. Les résultats concrets le confirment : Stripe, lors d'un accès anticipé, a utilisé Fable 5 pour effectuer une migration à l'échelle d'une base de code Ruby de 50 millions de lignes en une seule journée, une opération qui aurait nécessité plus de deux mois à une équipe humaine. Sur l'évaluation FrontierCode de Cognition, Fable 5 obtient les meilleurs scores parmi les modèles frontier, même à effort moyen. En analyse financière, il dépasse tous les modèles sur le Finance Benchmark de Hebbia, conçu pour simuler le raisonnement de niveau analyste senior. En vision, il est capable de reconstruire le code source d'une application web à partir de captures d'écran seules, et a terminé le jeu Pokémon FireRed avec un dispositif minimal basé uniquement sur la vision. Ces deux modèles s'inscrivent dans la continuité de Claude Mythos Preview, sorti en avril 2026 via le Project Glasswing, qui avait déjà établi un palier supérieur dans les capacités d'Anthropic. La bifurcation en deux versions distinctes, Fable et Mythos, reflète une tension croissante dans le secteur : comment rendre accessibles des modèles extrêmement puissants sans en faciliter les usages malveillants. Les classifieurs de Fable 5, des systèmes IA distincts qui détectent les tentatives de contournement et bloquent les requêtes problématiques, constituent la réponse d'Anthropic à ce dilemme. Mythos 5, lui, reste réservé à des partenaires sélectionnés notamment dans le domaine scientifique : selon Anthropic, il a permis d'accélérer certaines étapes de conception de médicaments d'un facteur dix, et les scientifiques ont préféré ses hypothèses en biologie moléculaire dans 80 % des cas lors de comparaisons en aveugle. Le modèle a également mené une semaine de recherche génomique quasi-autonome, entraînant un modèle sur des données de cellules individuelles couvrant 138 espèces animales, surpassant un modèle récemment publié dans Science malgré une taille cent fois inférieure.

LLMsOpinion

1 source

Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt

À lire aussi

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos

Anthropic déploie Claude Sonnet 5, restaure Fable et Mythos

Anthropic lance Claude Opus 4.8 : L’IA délivrée des hallucinations enfin arrivée ?

Anthropic lance Claude Fable 5 et Claude Mythos 5 : même modèle de base, garde-fous distincts, nouvelle catégorie Mythos