Aller au contenu principal
LLMsAWS ML Blog1h· 2 min de lecture

Claude Sonnet 5 arrive sur AWS : le modèle Sonnet le plus performant d'Anthropic

Source originale ↗·

Anthropic a annoncé le déploiement de Claude Sonnet 5 sur Amazon Bedrock et sur la Claude Platform disponible via AWS. Il s'agit du premier modèle Sonnet de la dernière génération d'Anthropic, conçu pour offrir une intelligence de premier plan au tarif Sonnet, destiné au code, aux agents autonomes et aux tâches professionnelles courantes à grande échelle. Sur Amazon Bedrock, les entreprises peuvent l'intégrer directement dans leur environnement AWS existant, en conservant la sécurité de niveau entreprise et la résidence régionale des données. Le modèle est également accessible via la Claude Platform sur AWS, ce qui permet d'utiliser les mêmes API et fonctionnalités que la plateforme native d'Anthropic, mais avec une facturation et une authentification unifiées sous AWS. Pour démarrer, les développeurs peuvent passer par la console Amazon Bedrock, sélectionner Claude Sonnet 5 dans l'espace de test Playground, ou y accéder par programmation via l'API Messages d'Anthropic, les points d'accès bedrock-runtime ou bedrock-mantle, ou encore les API Invoke et Converse via la ligne de commande AWS ou le SDK AWS.

Cette annonce marque un changement concret pour les équipes techniques qui développent des produits d'intelligence artificielle à grande échelle. Claude Sonnet 5 vise à offrir une intelligence proche de celle d'Opus tout en conservant l'équilibre coût-performance propre à la gamme Sonnet, ce qui en fait une option par défaut pour les usages quotidiens, là où Opus reste réservé aux tâches qui justifient un coût plus élevé. Le modèle est présenté comme capable de suivre un plan sur plusieurs étapes, de garder la trace de ce qui a déjà été fait et de corriger ses erreurs avec moins d'allers-retours, ce qui se traduit par un comportement plus prévisible en production. Pour le code, Anthropic met en avant sa capacité à naviguer dans des bases de code réelles, à appliquer des modifications sur plusieurs fichiers et à mener à bien des tâches longues de débogage ou de refactorisation. Pour les agents autonomes, il sert de socle plus fiable pour gérer des chaînes de dépendances complexes et des usages d'outils en plusieurs étapes, aussi bien pour des agents internes que pour des agents en contact avec les clients.

Anthropic cite plusieurs secteurs où ce nouveau modèle devrait avoir un impact direct. Dans la finance, Sonnet 5 est positionné pour la modélisation de tableurs, l'analyse financière et des agents de reporting capables de vérifier eux-mêmes leurs calculs tout au long du flux de travail, de l'ingestion des données jusqu'à la validation des résultats. Pour la productivité de bureau, il est annoncé pour la rédaction de rapports, leur audit, la rédaction de documents et l'analyse structurée, avec en complément des capacités d'utilisation d'ordinateur permettant d'automatiser des tâches de navigateur ou de bureau auparavant réalisées manuellement. Le modèle est présenté comme une mise à niveau directe par rapport à Sonnet 4.6, dans un contexte où la concurrence entre fournisseurs de cloud pour héberger les meilleurs modèles de langage s'intensifie, chaque acteur cherchant à attirer les entreprises qui veulent déployer de l'intelligence artificielle générative sans quitter leur infrastructure cloud existante.

Impact France/UE

Les entreprises europeennes utilisant Amazon Bedrock pourront deployer Claude Sonnet 5 en conservant la residence des donnees dans l'UE, sans impact reglementaire direct mentionne.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour
1VentureBeat AI 

Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour

Anthropic a lancé le 9 juin 2026 deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Claude Mythos 5, marquant la première mise à disposition grand public de capacités dites "Mythos-class" jusqu'alors réservées aux partenaires du programme restreint Project Glasswing, annoncé deux mois plus tôt. Claude Fable 5 constitue la version accessible au grand public et surpasse tous les modèles Claude précédemment disponibles sur des tâches de développement logiciel, de travail intellectuel, de vision, de recherche scientifique et de longues séquences d'actions autonomes. Claude Mythos 5, lui, est une version améliorée du Mythos Preview, accessible uniquement aux partenaires cybersécurité de Project Glasswing et à une sélection de chercheurs en biologie. Les deux modèles sont facturés 10 dollars par million de tokens en entrée et 50 dollars par million en sortie, soit moins de la moitié du prix du Mythos Preview, mais ils demeurent les modèles les plus chers parmi les grands acteurs mondiaux de l'IA. Ce lancement introduit une architecture de sécurité inédite pour rendre les capacités Mythos accessibles sans les risques associés. Pour les requêtes jugées sensibles, notamment en cybersécurité, biologie, chimie ou distillation de modèles, Fable 5 redirige automatiquement vers Claude Opus 4.8 en notifiant l'utilisateur. Anthropic indique que plus de 95% des sessions Fable s'exécutent entièrement sur le modèle Fable sans ce repli, et que plus de 1 000 heures de tests adversariaux internes et externes n'ont révélé aucun contournement universel. Pour les développeurs, Fable 5 est disponible via l'API sous l'identifiant claude-fable-5 et sur les plans Enterprise à la consommation. Les abonnés Pro, Max, Team et Enterprise bénéficient d'un accès gratuit jusqu'au 22 juin 2026, date à laquelle le modèle basculera sur un système de crédits d'utilisation, Anthropic promettant de le réintégrer le plus vite possible dans les abonnements standards. Ce lancement s'inscrit dans une course aux capacités avancées qui divise désormais clairement le marché entre modèles grand public et modèles réservés à des usages à risque élevé. Anthropic avait ouvert Project Glasswing il y a deux mois pour permettre à des partenaires triés sur le volet d'accéder à des capacités cybersécurité offensives sous contrôle strict, une approche qui fait débat dans le secteur. Avec Fable 5, la société tente de commercialiser ces capacités à grande échelle tout en maintenant des garde-fous techniques. La concurrence est intense: DeepSeek, Google Gemini, xAI Grok et OpenAI GPT-5 couvrent désormais un spectre de prix allant de 0,42 à 35 dollars pour l'entrée et la sortie combinées, rendant le positionnement tarifaire d'Anthropic à 60 dollars le million de tokens cumulés difficile à justifier sans performances nettement supérieures sur les benchmarks les plus exigeants.

UELes développeurs et entreprises européens peuvent accéder à Claude Fable 5 via l'API dès maintenant, avec un accès gratuit jusqu'au 22 juin 2026 pour les abonnés payants, avant un basculement vers un système de crédits dont le tarif élevé (60 $ par million de tokens cumulés) pourrait freiner l'adoption au sein des startups et PME du continent.

💬 Le mécanisme de bascule automatique vers Opus pour les requêtes sensibles, c'est plus malin qu'un simple blocage, et c'est là la vraie nouveauté du lancement. Les benchmarks, on verra. Reste le prix : 60 dollars le million de tokens quand la moitié du marché est sous 5 dollars, c'est soit de la confiance assumée, soit un tarif qu'ils vont devoir revoir dans 6 mois.

LLMsOpinion
1 source
Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !
2Le Big Data 

Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !

Anthropic s'apprêterait à lancer Claude Opus 4.7, la prochaine itération de son modèle phare, potentiellement dès cette semaine. L'information provient de The Information, qui rapporte que l'identifiant "Claude Opus 4.7" a déjà été repéré dans les références internes de l'API d'Anthropic, un signal qui précède généralement de peu une annonce officielle. Un utilisateur du réseau X, sous le pseudonyme BridgeMind, a également alimenté les spéculations en relevant que Claude Opus 4.5 avait été publié 73 jours avant Opus 4.6, sorti le 5 février 2026. Au 14 avril, 68 jours s'étaient déjà écoulés depuis cette dernière version, plaçant la prochaine sortie dans la fenêtre habituelle de déploiement. Le code source de Claude Code ayant par ailleurs déjà mentionné Opus 4.7, les indices convergent, sans qu'Anthropic ait pour autant confirmé quoi que ce soit officiellement. Si les rumeurs s'avèrent fondées, Claude Opus 4.7 apporterait des améliorations substantielles sur plusieurs fronts critiques : le raisonnement en plusieurs étapes, la gestion de tâches longues et complexes, et surtout la coordination entre agents d'IA. Anthropic travaillerait sur un concept d'"équipe d'agents", où plusieurs modèles collaborent sur un même problème comme le ferait un groupe de travail humain. Cette architecture permettrait à des systèmes autonomes de fonctionner pendant de longues périodes avec une intervention humaine minimale, une capacité très attendue par les entreprises qui intègrent l'IA dans leurs workflows. En parallèle, The Information évoque également un assistant tout-en-un capable de gérer des tâches complètes comme la création de sites web ou de présentations, en intégrant rédaction, design et mise en place technique dans un processus unifié. Ce lancement s'inscrit dans une course effrénée entre les grands laboratoires d'IA. OpenAI, Google et Anthropic accélèrent tous leurs cycles de publication, les intervalles entre versions majeures se réduisant à quelques semaines. Anthropic, fondée en 2021 par d'anciens cadres d'OpenAI dont Dario et Daniela Amodei, positionne Claude comme une alternative axée sur la sécurité et la fiabilité. Avec Opus 4.7, la société chercherait à consolider son avance sur le segment des agents autonomes et des tâches longue durée, un marché entreprise à fort potentiel. Les suites dépendront de la réaction des concurrents : OpenAI prépare ses propres modèles o3 et GPT-5, tandis que Google continue de faire évoluer Gemini Ultra. La semaine à venir pourrait donc marquer une nouvelle étape dans la compétition mondiale pour les modèles de langage de pointe.

LLMsOpinion
1 source
Claude Opus 4.8 est désormais disponible sur AWS
3AWS ML Blog 

Claude Opus 4.8 est désormais disponible sur AWS

Anthropic a annoncé la disponibilité de Claude Opus 4.8, son modèle le plus avancé de la gamme Opus, sur Amazon Bedrock et sur la Claude Platform déployée sur AWS. Ce lancement permet aux équipes de développement d'intégrer le modèle directement dans leurs environnements AWS existants, tout en bénéficiant des garanties de sécurité entreprise, de résidence régionale des données et de la scalabilité d'infrastructure propres à Amazon. Pour les cas d'usage ne nécessitant pas de résidence régionale, le modèle est également accessible via la plateforme native d'Anthropic hébergée sur AWS. Techniquement, l'accès se fait via le SDK Anthropic avec l'identifiant de modèle us.anthropic.claude-opus-4-8, ou via les API Invoke et Converse d'Amazon Bedrock. Ce qui distingue Opus 4.8 de ses prédécesseurs, c'est sa capacité à maintenir un plan d'action sur plusieurs étapes successives, à suivre ce qui a été accompli et ce qui reste à faire, et surtout à se recorriger lorsqu'un blocage survient plutôt que de simplement s'arrêter sur une erreur. Pour les équipes qui automatisent des tâches longues et complexes, cette stabilité se traduit concrètement par moins de variance dans les sorties, moins de cycles de révision manuelle, et une supervision réduite des pipelines en production. En développement logiciel, le modèle est conçu pour naviguer dans de vraies bases de code, planifier avant d'éditer, et conserver le contexte sur des sessions prolongées. Les cas d'usage industriels ciblés incluent la recherche d'investissement et l'analyse de résultats financiers, la rédaction de contrats et de mémoires juridiques, la synthèse de littérature scientifique et de soumissions réglementaires en sciences du vivant, ainsi que l'analyse de menaces et la réponse à incident en cybersécurité. Ce lancement s'inscrit dans une stratégie de partenariat approfondi entre Anthropic et AWS, qui s'est notamment matérialisée par un investissement d'Amazon pouvant atteindre quatre milliards de dollars dans Anthropic. La disponibilité sur Bedrock est stratégique pour Anthropic, qui cherche à s'imposer comme fournisseur de référence pour les déploiements en entreprise, face à la concurrence directe d'OpenAI via Azure et de Google DeepMind via Vertex AI. Opus 4.8 représente le haut de gamme de la nouvelle génération Claude 4, une famille de modèles qui comprend également Sonnet 4.6 et Haiku 4.5, chacun positionné sur un équilibre différent entre performance et coût d'inférence. La prochaine étape pour Anthropic sera probablement d'élargir la disponibilité régionale du modèle sur Bedrock, et d'affiner ses capacités dans les domaines où la régulation de l'IA évolue rapidement.

UELes entreprises européennes peuvent déployer Claude Opus 4.8 sur Amazon Bedrock avec résidence régionale des données, facilitant la conformité RGPD pour les cas d'usage en production.

LLMsActu
1 source
Le mode Auto d'Anthropic supprime la supervision manuelle de Claude
4AI Business 

Le mode Auto d'Anthropic supprime la supervision manuelle de Claude

Anthropic a lancé un nouveau mode "Auto" pour son assistant Claude, qui permet au modèle de choisir automatiquement son niveau de raisonnement selon la tâche — sans que l'utilisateur ait à configurer manuellement les paramètres à chaque utilisation. Disponible sur Claude.ai et via l'API, la fonctionnalité vise à simplifier l'expérience pour les développeurs et les utilisateurs réguliers. Le gain de temps est réel : fini de "surveiller" le modèle pour ajuster son mode de fonctionnement. Mais cette autonomie accrue a un revers — en laissant Claude décider seul, le risque d'hallucinations augmente et la qualité du code généré pourrait en pâtir dans certains cas. Le contrôle manuel restait une garantie tacite de cohérence. Ce lancement reflète la course des éditeurs d'IA à rendre leurs outils plus fluides, au prix parfois d'un compromis entre commodité et fiabilité.

LLMsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic