Aller au contenu principal
BusinessThe Decoder4h· 1 min de lecture

Claude Sonnet 5 confirme la tendance d'Anthropic à masquer des hausses de prix via des tarifs par token inchangés

Source originale ↗·

Claude Sonnet 5, le dernier modèle d'Anthropic, se classe cinquième de l'Artificial Analysis Intelligence Index avec un score de 53 points, et surpasse même le modèle plus onéreux Opus 4.8 sur certaines tâches agentiques. Problème : le modèle consomme environ 40 % de tokens en plus par tâche que son prédécesseur, ce qui fait quasiment doubler le coût réel pour les utilisateurs, alors même que les tarifs affichés par token restent identiques. Selon The Decoder, cette pratique s'inscrit dans une tendance récurrente chez Anthropic, qui masquerait ainsi des hausses de prix derrière des grilles tarifaires en apparence inchangées.

Cette opacité tarifaire a des conséquences concrètes pour les entreprises et développeurs qui intègrent Claude dans leurs produits : budgéter l'usage d'un modèle devient difficile lorsque le coût réel par tâche grimpe sans que le prix unitaire ne bouge officiellement. Pour les équipes qui optimisent leurs dépenses d'IA générative, cela signifie qu'un modèle apparemment plus performant peut en réalité coûter bien plus cher à l'usage, remettant en question les comparatifs basés uniquement sur les prix par token. Cette situation fragilise la confiance des clients professionnels dans la lisibilité des offres des fournisseurs de modèles.

Ce phénomène s'inscrit dans une dynamique plus large où les laboratoires d'IA, poussés par l'explosion des coûts de calcul et d'entraînement, cherchent à maintenir des prix catalogue attractifs tout en captant davantage de valeur via la consommation réelle de tokens, notamment sur les tâches agentiques complexes qui multiplient les étapes de raisonnement. Reste à savoir si la pression concurrentielle, notamment face à OpenAI et Google, poussera Anthropic vers davantage de transparence sur les coûts réels, ou si cette stratégie de tarification perdurera à mesure que les modèles gagnent en complexité et en gourmandise en tokens.

Impact France/UE

Les entreprises europeennes utilisant l'API Claude via leurs produits devront revoir leurs budgets, le cout reel par tache augmentant sans hausse affichee des tarifs par token.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens
1Next INpact 

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

OpenAI et Anthropic étudient sérieusement une réduction du prix des tokens, selon des informations rapportées par le Wall Street Journal. Sam Altman a lui-même reconnu lors d'un événement public que le coût du token constituait un « gros problème », affirmant qu'OpenAI cherchait des moyens de permettre à ses clients « d'en faire plus tout en dépensant moins ». Le patron d'OpenAI anticiperait notamment une baisse des prix chez son rival Anthropic, dont l'outil Claude Code est devenu un incontournable dans de nombreuses équipes de développement. Pour les entreprises, chaque requête adressée à GPT ou Claude génère une consommation de tokens qui s'accumule rapidement sur les factures : selon l'analyste Ed Zitron, les utilisateurs peuvent actuellement dépenser entre 8 et 13,50 dollars pour chaque dollar de revenus d'abonnement encaissés par les labos. Le directeur technique d'Uber a d'ailleurs témoigné avoir épuisé son budget IA annuel en seulement quatre mois. Une baisse des prix serait une excellente nouvelle pour les entreprises dont les coûts d'infrastructure IA explosent au rythme de l'adoption, mais elle soulève une contradiction majeure : ni OpenAI ni Anthropic ne sont encore rentables. Les revenus générés par chaque token facturé peinent à couvrir les coûts colossaux des centres de données, des puces Nvidia et du développement continu de nouveaux modèles. Lancer une guerre tarifaire dans ce contexte repousserait encore l'horizon de la rentabilité pour les deux entreprises qui se préparent à entrer en Bourse. Les clients bénéficieraient immédiatement de marges réduites, mais les investisseurs, eux, attendraient encore. La bataille se joue également sur le terrain des outils de développement : Claude Code a pris de l'avance dans les usages professionnels, forçant OpenAI à riposter avec Codex, en position de retard. C'est précisément parce que ces outils sont devenus des postes de dépense significatifs dans les budgets tech que la question du prix du token est devenue stratégique. La baisse des prix de l'inférence suit une tendance de fond depuis 2023, tirée par la concurrence avec des acteurs comme Google et les fournisseurs open source. Mais si OpenAI et Anthropic s'alignent mutuellement à la baisse sans se différencier sur d'autres critères, ils risquent de transformer leurs modèles en commodités interchangeables, où seul le tarif compte. La prochaine étape sera de voir si l'un des deux franchit le premier le pas, entraînant l'autre dans une spirale baissière difficile à arrêter.

UEUne baisse des prix des tokens réduirait directement les coûts d'infrastructure IA des entreprises et startups européennes dépendantes des APIs OpenAI et Anthropic.

💬 Que ça baisse enfin, personne va s'en plaindre, et le CTO d'Uber qui a épuisé son budget IA en quatre mois dit tout sur l'urgence. Le vrai risque, c'est qu'ils s'alignent l'un sur l'autre sans rien d'autre à offrir, et que leurs modèles finissent par ne se distinguer que par le tarif. C'est là que Google et l'open source attendent.

BusinessOpinion
1 source
Anthropic suspend la facturation au token pour son Claude Agent SDK
2Ars Technica AI 

Anthropic suspend la facturation au token pour son Claude Agent SDK

Anthropic a fait volte-face sur une modification tarifaire majeure concernant son Claude Agent SDK. Annoncée le 13 mai dernier, cette réforme devait entrer en vigueur le 15 juin : elle prévoyait de facturer séparément l'usage du SDK d'automatisation, qu'il soit réalisé via des applications tierces ou la commande programmatique "claude -p", aux tarifs de l'API Anthropic. Chaque abonné aurait reçu un crédit mensuel équivalent au prix de son abonnement, sans bénéficier des plafonds d'utilisation hebdomadaires actuellement inclus. Lundi, Anthropic a brusquement annoncé la suspension de ce changement, maintenant le statu quo et permettant aux utilisateurs du SDK de continuer à puiser dans les limites généreuses de leur abonnement existant. Cette pause est significative car l'écart entre abonnement et tarification API est considérable. Selon une analyse citée dans l'article, les abonnés Claude Opus commencent à rentabiliser leur souscription dès deux à trois échanges quotidiens seulement, et la valeur réelle de leur forfait peut représenter plusieurs fois son coût mensuel si on la convertit en tokens API. La réforme initiale aurait donc frappé en priorité les utilisateurs intensifs et les développeurs qui s'appuient sur le SDK pour automatiser des tâches complexes via des services tiers, en augmentant substantiellement leurs coûts réels. Ce revirement illustre la tension croissante entre Anthropic et sa base d'utilisateurs avancés, au moment où le Claude Agent SDK gagne en popularité pour orchestrer des agents IA autonomes. En factualisant l'usage SDK comme de la consommation API ordinaire, Anthropic cherchait à récupérer une partie de la valeur économique capturée par des abonnés très actifs, un modèle économique difficile à tenir à grande échelle. La suspension rapide, intervenue le jour même de l'entrée en vigueur prévue, suggère que la pression de la communauté a joué un rôle, mais Anthropic n'a pas précisé si la réforme reviendra sous une forme modifiée ni à quelle échéance.

UELes développeurs et entreprises européennes utilisant le Claude Agent SDK peuvent continuer à exploiter l'outil dans les limites de leur abonnement existant, évitant une hausse substantielle des coûts qui aurait pu freiner l'adoption des agents IA autonomes.

BusinessActu
1 source
Des ingénieurs Amazon distilleraient les modèles Anthropic pour réduire les coûts avant la nouvelle tarification par token
3The Decoder 

Des ingénieurs Amazon distilleraient les modèles Anthropic pour réduire les coûts avant la nouvelle tarification par token

Des ingénieurs d'Amazon sont en train de distiller les modèles d'Anthropic pour en créer des versions plus légères et moins coûteuses, destinées à un usage interne. Cette initiative intervient avant un changement de modèle tarifaire prévu pour l'an prochain : Amazon paiera alors ses accès aux modèles d'Anthropic à la consommation de tokens, et non plus à l'heure de calcul. Selon les informations rapportées par The Decoder, cette transition pourrait faire grimper significativement la facture pour le géant du e-commerce, qui utilise massivement ces modèles dans ses propres outils et services. La distillation de modèles est une technique qui consiste à entraîner un modèle plus compact à imiter le comportement d'un modèle plus grand, en reproduisant ses sorties plutôt que ses paramètres internes. Le résultat est un modèle moins puissant mais nettement moins gourmand en ressources. Pour Amazon, qui déploie des capacités d'IA à grande échelle en interne, réduire le coût par requête représente un enjeu financier considérable. La société explore également des alternatives, dont les modèles d'OpenAI, ce qui suggère une volonté de ne pas se retrouver trop dépendante d'un seul fournisseur. Cette situation révèle une tension croissante entre les grands hyperscalers et leurs fournisseurs de modèles. Amazon a investi plus de quatre milliards de dollars dans Anthropic depuis 2023, faisant du partenariat l'un des plus importants de l'industrie. Mais l'intérêt stratégique et les impératifs économiques divergent : quand les coûts d'utilisation deviennent trop élevés, même les partenaires investisseurs cherchent à contourner la dépendance. Cette dynamique pourrait accélérer la tendance des grandes entreprises tech à développer ou adapter leurs propres modèles en interne.

BusinessOpinion
1 source
4The Decoder 

OpenAI réduit de moitié son abonnement Pro à 100 $ pour les gros utilisateurs de Codex, sous les tarifs d'Anthropic et Google

OpenAI restructure ses offres d'abonnement avec un nouveau plan Pro à 100 dollars par mois, soit la moitié du prix de l'ancien abonnement Pro à 200 dollars. Le changement principal concerne les utilisateurs intensifs de Codex, l'outil de génération de code d'OpenAI, qui bénéficient désormais d'un quota d'utilisation nettement supérieur à ce tarif réduit. Cette annonce positionne OpenAI directement en dessous des offres premium d'Anthropic et de Google dans la bataille des abonnements IA haut de gamme. Pour les développeurs et professionnels faisant un usage intensif de Codex, la réduction est substantielle. À 100 dollars mensuels, OpenAI rend son niveau d'accès le plus avancé accessible à un public plus large, tout en se différenciant tarifairement face à Claude Pro d'Anthropic et à Gemini Advanced de Google, dont les offres équivalentes restent plus chères ou moins généreuses en usage Codex. L'objectif est clair : attirer et fidéliser les développeurs qui constituent le coeur de l'adoption entreprise des modèles d'OpenAI. Ce mouvement s'inscrit dans une guerre des prix qui s'intensifie entre les grands acteurs de l'IA générative. OpenAI, malgré sa position de leader du marché, fait face à une concurrence croissante d'Anthropic avec ses modèles Claude et de Google avec Gemini, tous deux ayant considérablement renforcé leurs capacités de génération de code ces derniers mois. En ciblant explicitement les gros utilisateurs de Codex avec cette offre, OpenAI envoie un signal à l'ensemble de l'écosystème développeur : la compétition sur les prix est désormais aussi importante que la compétition sur les performances.

UELes développeurs français et européens utilisant Codex peuvent désormais accéder au niveau Pro d'OpenAI à 100 $/mois au lieu de 200 $, réduisant la barrière tarifaire face aux offres concurrentes d'Anthropic et Google.

BusinessOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic