Aller au contenu principal
Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt
LLMsFrandroid1j

Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt

Résumé IASource uniqueImpact UE
Source originale ↗·

Anthropic lance Claude Opus 4.8 le 28 mai 2026, disponible au même tarif que son prédécesseur direct Opus 4.7. La mise à jour introduit un mode rapide proposé à un coût trois fois inférieur, rendant le modèle plus accessible pour les applications à fort volume d'appels API. Anthropic annonce également un renforcement des capacités d'honnêteté du modèle, un axe de développement central dans sa philosophie d'alignement. Sur les benchmarks publiés, Opus 4.8 surpasse GPT-5.5 d'OpenAI sur plusieurs métriques de référence. En parallèle, l'entreprise a déjà déployé Mythos, un modèle encore plus puissant, auprès d'un cercle restreint d'utilisateurs, sans calendrier officiel de sortie grand public pour l'instant.

Le maintien du tarif d'Opus 4.7 tout en livrant des performances supérieures constitue une pression directe sur la concurrence. La division par trois du coût du mode rapide ouvre des perspectives concrètes pour les entreprises qui déploient des pipelines à grande échelle, où le coût par token est déterminant. L'amélioration de l'honnêteté répond aux préoccupations croissantes des utilisateurs professionnels sur la fiabilité des modèles, notamment dans les contextes juridiques, médicaux et financiers.

Cette sortie s'inscrit dans une course aux modèles qui s'est considérablement accélérée depuis début 2026, avec OpenAI, Google et Meta enchaînant les mises à jour majeures à un rythme sans précédent. L'existence de Mythos, maintenu en accès restreint malgré sa maturité opérationnelle, illustre la stratégie de déploiement graduel d'Anthropic, qui préfère affiner en cercle fermé avant d'ouvrir au grand public. La société fondée par Dario et Daniela Amodei se positionne ainsi comme un acteur qui mise sur la prudence et la performance simultanément, cherchant à capturer une clientèle entreprise exigeante sans sacrifier la sécurité.

Impact France/UE

Les entreprises européennes utilisant l'API Claude bénéficieront du mode rapide trois fois moins cher, réduisant significativement les coûts de déploiement à grande échelle pour les pipelines à fort volume d'appels.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos
1VentureBeat AI 

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos

Anthropic a lancé le 28 mai 2026 Claude Opus 4.8, une mise à jour de son modèle phare, disponible immédiatement sur claude.ai, Claude Code, l'API et Cowork. La tarification standard reste inchangée par rapport à Opus 4.7 : 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie. La grande nouveauté est le mode rapide ("fast mode"), qui génère les tokens à environ 2,5 fois la vitesse normale et voit son prix chuter à 10 dollars par million de tokens en entrée et 50 dollars en sortie, soit une réduction de trois fois par rapport aux 30/150 dollars du mode rapide d'Opus 4.7. Sur les benchmarks, les progrès sont réels mais modestes : 88,6 % sur SWE-bench Verified (contre 87,6 % pour Opus 4.7), 69,2 % sur SWE-bench Pro (contre 64,3 %) et 74,6 % sur Terminal-Bench 2.1 (contre 66,1 %). Opus 4.8 surpasse également GPT-5.5 d'OpenAI sur au moins 12 benchmarks, notamment en raisonnement, en codage et en utilisation d'outils agentiques. Cette baisse tarifaire sur le mode rapide est significative pour l'industrie : elle rend l'inférence à haut débit accessible aux applications de production sensibles à la latence, un segment jusqu'ici réservé aux modèles moins puissants. Databricks a rapporté une réduction de 61 % du coût en tokens par rapport à Opus 4.7, grâce à une meilleure efficacité multimodale sur les PDF et diagrammes. La startup Cognition, éditrice de Devin, confirme que le modèle corrige des problèmes de verbosité et d'appels d'outils présents dans Opus 4.7. Un fournisseur spécialisé en computer-use a atteint 84 % sur le benchmark Online-Mind2Web, dépassant à la fois Opus 4.7 et GPT-5.5. Anthropic introduit également en préversion les "dynamic workflows" dans Claude Code, permettant de lancer des centaines de sous-agents en parallèle pour des tâches dépassant la capacité d'une seule fenêtre de contexte. Opus 4.8 s'inscrit dans une trajectoire d'accélération chez Anthropic, qui positionne ce modèle entre Opus 4.7 et Claude Mythos Preview, un modèle plus puissant actuellement limité à un petit nombre d'organisations dans le cadre du Project Glasswing, dédié à la cybersécurité. Anthropic a annoncé vouloir mettre des "modèles de classe Mythos" à la disposition de l'ensemble de ses clients dans les prochaines semaines, une fois des garde-fous cyber supplémentaires en place. La course au sommet se joue désormais sur plusieurs fronts simultanément : la puissance brute, le coût d'inférence et les capacités agentiques, trois axes où OpenAI, Google et les acteurs chinois comme DeepSeek ou Alibaba exercent une pression croissante sur Anthropic.

UELa réduction tarifaire du mode rapide (3x moins cher) rend l'inférence haute performance directement accessible aux développeurs et entreprises européens qui déploient des LLMs en production.

💬 Le vrai truc, c'est pas les benchmarks (modestes, clairement), c'est le fast mode à 10 dollars le million de tokens, trois fois moins cher qu'Opus 4.7 : ça rend enfin l'inférence haute vitesse viable en prod sans sacrifier un modèle plus faible. Les dynamic workflows dans Claude Code, des centaines de sous-agents en parallèle, c'est le genre de truc qu'on attendait depuis 2 ans. Et Mythos pour tout le monde dans les semaines qui viennent, bon, sur le papier c'est prometteur.

LLMsActu
1 source
Anthropic lance Claude Opus 4.8 : L’IA délivrée des hallucinations enfin arrivée ?
2Le Big Data 

Anthropic lance Claude Opus 4.8 : L’IA délivrée des hallucinations enfin arrivée ?

Anthropic a lancé le 28 mai 2026 Claude Opus 4.8, la nouvelle version de son modèle phare, disponible immédiatement au même tarif que son prédécesseur Opus 4.7. Le modèle affiche des performances notables sur les benchmarks techniques : 69,2 % sur SWE-Bench Pro et 74,6 % sur Agentic Terminal Coding, des scores qui le placent devant GPT-5.5 d'OpenAI et Gemini 3.1 Pro de Google selon les comparatifs publiés par Anthropic. Dans Claude Code, l'entreprise introduit un système de flux de travail dynamiques capable de générer des scripts JavaScript pour orchestrer des centaines de sous-agents en parallèle. Un utilisateur a rapporté avoir réécrits 750 000 lignes de code en 11 jours grâce à ce système. Un mode rapide est également disponible via la commande /fast : même modèle, vitesse 2,5 fois supérieure, coût réduit de près des deux tiers. La principale promesse d'Opus 4.8 n'est pas spectaculaire mais potentiellement décisive : la fiabilité. Anthropic cible directement le problème des hallucinations et de la fausse confiance qui plombe l'adoption des IA en contexte professionnel. Le modèle serait désormais capable de reconnaître ses propres limites, de signaler ses incertitudes et d'identifier des incohérences dans ses propres analyses avant que l'utilisateur ne s'en aperçoive. Michael Ran de Bridgewater Associates, la plus grande société de gestion de fonds au monde, témoigne que Claude Opus 4.8 repère de lui-même certains problèmes dans les analyses produites, là où d'autres modèles laissaient passer les erreurs silencieusement. Anthropic affirme également avoir réduit les risques de comportements désalignés et amélioré la gestion des contenus sensibles. Opus 4.8 s'inscrit dans un cycle de publication accéléré chez Anthropic : Opus 4.7 n'avait été lancé que quelques semaines auparavant. L'entreprise prend soin de qualifier cette nouvelle version d'amélioration « modeste mais tangible », une prudence qui répond aux critiques adressées à Opus 4.7, accusé d'une réflexion adaptative mal calibrée, trop de temps sur les tâches simples, trop peu sur les complexes. Pour corriger ce défaut, Anthropic introduit un panneau de contrôle de l'effort permettant aux utilisateurs d'ajuster le niveau de réflexion du modèle selon la nature de la tâche. La course à la fiabilité devient ainsi le nouveau front concurrentiel entre les grands laboratoires, après la course aux paramètres et aux benchmarks bruts qui a dominé les deux dernières années.

LLMsOpinion
1 source
Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !
3Le Big Data 

Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !

Anthropic s'apprêterait à lancer Claude Opus 4.7, la prochaine itération de son modèle phare, potentiellement dès cette semaine. L'information provient de The Information, qui rapporte que l'identifiant "Claude Opus 4.7" a déjà été repéré dans les références internes de l'API d'Anthropic, un signal qui précède généralement de peu une annonce officielle. Un utilisateur du réseau X, sous le pseudonyme BridgeMind, a également alimenté les spéculations en relevant que Claude Opus 4.5 avait été publié 73 jours avant Opus 4.6, sorti le 5 février 2026. Au 14 avril, 68 jours s'étaient déjà écoulés depuis cette dernière version, plaçant la prochaine sortie dans la fenêtre habituelle de déploiement. Le code source de Claude Code ayant par ailleurs déjà mentionné Opus 4.7, les indices convergent, sans qu'Anthropic ait pour autant confirmé quoi que ce soit officiellement. Si les rumeurs s'avèrent fondées, Claude Opus 4.7 apporterait des améliorations substantielles sur plusieurs fronts critiques : le raisonnement en plusieurs étapes, la gestion de tâches longues et complexes, et surtout la coordination entre agents d'IA. Anthropic travaillerait sur un concept d'"équipe d'agents", où plusieurs modèles collaborent sur un même problème comme le ferait un groupe de travail humain. Cette architecture permettrait à des systèmes autonomes de fonctionner pendant de longues périodes avec une intervention humaine minimale, une capacité très attendue par les entreprises qui intègrent l'IA dans leurs workflows. En parallèle, The Information évoque également un assistant tout-en-un capable de gérer des tâches complètes comme la création de sites web ou de présentations, en intégrant rédaction, design et mise en place technique dans un processus unifié. Ce lancement s'inscrit dans une course effrénée entre les grands laboratoires d'IA. OpenAI, Google et Anthropic accélèrent tous leurs cycles de publication, les intervalles entre versions majeures se réduisant à quelques semaines. Anthropic, fondée en 2021 par d'anciens cadres d'OpenAI dont Dario et Daniela Amodei, positionne Claude comme une alternative axée sur la sécurité et la fiabilité. Avec Opus 4.7, la société chercherait à consolider son avance sur le segment des agents autonomes et des tâches longue durée, un marché entreprise à fort potentiel. Les suites dépendront de la réaction des concurrents : OpenAI prépare ses propres modèles o3 et GPT-5, tandis que Google continue de faire évoluer Gemini Ultra. La semaine à venir pourrait donc marquer une nouvelle étape dans la compétition mondiale pour les modèles de langage de pointe.

LLMsOpinion
1 source
Anthropic lance Claude Opus 4.8 : amélioration modeste mais concrète, devant GPT-5.5 sur la plupart des benchmarks
4The Decoder 

Anthropic lance Claude Opus 4.8 : amélioration modeste mais concrète, devant GPT-5.5 sur la plupart des benchmarks

Anthropic a dévoilé Claude Opus 4.8, que la société qualifie d'amélioration "modeste mais tangible" de son modèle phare. La nouvelle version surpasse GPT-5.5 d'OpenAI et Gemini 3.1 Pro de Google sur la majorité des benchmarks publiés. En programmation, Claude Opus 4.8 détecte ses propres erreurs de code quatre fois plus souvent que son prédécesseur. Anthropic lance simultanément les "dynamic workflows", une fonctionnalité permettant de déployer des centaines d'agents parallèles pour des tâches complexes comme la migration de bases de code entières. Cette progression renforce la position d'Anthropic face à ses concurrents directs. La capacité à détecter et corriger ses propres erreurs de code change concrètement le quotidien des développeurs, qui peuvent confier des tâches de refactoring ou de débogage plus longues avec un niveau de fiabilité accru. Les workflows dynamiques ouvrent la voie à des pipelines d'automatisation à grande échelle, particulièrement utiles pour les équipes techniques gérant de larges bases de code. Cette sortie s'inscrit dans une compétition intense entre les grands laboratoires d'IA. OpenAI, Google et Anthropic publient désormais des mises à jour à un rythme soutenu, chacun cherchant à capter les budgets entreprises. L'accent mis sur les agents autonomes et les workflows parallèles reflète un glissement stratégique : l'IA prend désormais en charge des processus entiers plutôt que de simples requêtes isolées. Les prochains mois diront si ces gains de benchmarks se confirment dans des environnements de production réels.

UELes développeurs et entreprises tech européens disposent d'un nouveau modèle SOTA avec des capacités agentiques avancées pour automatiser des pipelines de développement logiciel à grande échelle.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour