Claude Sonnet 5, Sonnet 4.6 et Opus 4.8 : benchmarks de codage autonome, prix API et coût-performance comparés
Anthropic a lancé Claude Sonnet 5 le 30 juin 2026, présenté comme son modèle Sonnet le plus agentique à ce jour, capable de planifier des tâches, de piloter des navigateurs et des terminaux, et de fonctionner de façon autonome sur des missions longues. Il devient le modèle par défaut des offres Free et Pro, tandis que les utilisateurs Max, Team et Enterprise peuvent le sélectionner manuellement ; il est également disponible dans Claude Code et sur la Claude Platform. Sur les benchmarks publiés par Anthropic, Sonnet 5 dépasse son prédécesseur Sonnet 4.6 sur tous les tests : 63,2% contre 58,1% sur SWE-bench Pro (l'évaluation de codage agentique), 81,2% contre 78,5% sur OSWorld-Verified (usage d'ordinateur), et 80,4% contre 67,0% sur Terminal-Bench 2.1. Sur Humanity's Last Exam avec outils, il atteint 57,4%, un score qui talonne celui d'Opus 4.8, le modèle haut de gamme d'Anthropic, à 57,9%. Fait notable, sur le benchmark de travail de connaissance GDPval-AA v2, Sonnet 5 devance même Opus 4.8, avec 1 618 points contre 1 615.
Cette montée en puissance intervient à un prix inférieur à celui du modèle phare de la firme. Anthropic propose un tarif de lancement de 2 dollars pour un million de tokens en entrée et 10 dollars en sortie, valable jusqu'au 31 août 2026, avant de passer à 3 et 15 dollars ; Opus 4.8, lui, reste à 5 et 25 dollars. Le modèle expose quatre niveaux d'effort de raisonnement (bas, moyen, élevé et extra-élevé), chaque palier supplémentaire augmentant à la fois la qualité des réponses et leur coût en tokens. Pour les développeurs, cela dessine une politique de routage claire : confier la majorité des tâches de codage agentique, d'utilisation d'outils et de travail de connaissance à Sonnet 5 aux niveaux d'effort bas ou moyen, où il offre le meilleur rapport qualité-prix, et réserver Opus 4.8 aux tâches critiques nécessitant une précision maximale, d'autant qu'à l'effort le plus élevé, Sonnet 5 peut finir par coûter plus cher qu'Opus pour une qualité comparable. Anthropic indique aussi avoir volontairement limité les capacités offensives en cybersécurité du modèle, le rendant plus sûr que Sonnet 4.6 mais moins fiable qu'Opus sur les usages où l'exactitude prime.
Sonnet 5 succède à Sonnet 4.6, lancé en février 2026, et occupe la position intermédiaire de la gamme d'Anthropic, au-dessus du modèle économique Haiku 4.5 et en dessous d'Opus 4.8. Il utilise un tokenizer mis à jour, identique à celui introduit avec Opus 4.7, qui peut faire gonfler le nombre de tokens nécessaires pour un même texte d'un facteur allant jusqu'à 1,35, un détail à prendre en compte dans le calcul des coûts réels. Cette sortie illustre la stratégie d'Anthropic consistant à concentrer l'innovation sur la fiabilité agentique plutôt que sur un seul score record, dans un marché où la concurrence entre modèles se joue de plus en plus sur l'autonomie et l'efficacité économique en production, plus que sur la performance brute isolée.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




