Aller au contenu principal
BusinessThe Decoder2h· 1 min de lecture

Des ingénieurs Amazon distilleraient les modèles Anthropic pour réduire les coûts avant la nouvelle tarification par token

Source originale ↗·

Des ingénieurs d'Amazon sont en train de distiller les modèles d'Anthropic pour en créer des versions plus légères et moins coûteuses, destinées à un usage interne. Cette initiative intervient avant un changement de modèle tarifaire prévu pour l'an prochain : Amazon paiera alors ses accès aux modèles d'Anthropic à la consommation de tokens, et non plus à l'heure de calcul. Selon les informations rapportées par The Decoder, cette transition pourrait faire grimper significativement la facture pour le géant du e-commerce, qui utilise massivement ces modèles dans ses propres outils et services.

La distillation de modèles est une technique qui consiste à entraîner un modèle plus compact à imiter le comportement d'un modèle plus grand, en reproduisant ses sorties plutôt que ses paramètres internes. Le résultat est un modèle moins puissant mais nettement moins gourmand en ressources. Pour Amazon, qui déploie des capacités d'IA à grande échelle en interne, réduire le coût par requête représente un enjeu financier considérable. La société explore également des alternatives, dont les modèles d'OpenAI, ce qui suggère une volonté de ne pas se retrouver trop dépendante d'un seul fournisseur.

Cette situation révèle une tension croissante entre les grands hyperscalers et leurs fournisseurs de modèles. Amazon a investi plus de quatre milliards de dollars dans Anthropic depuis 2023, faisant du partenariat l'un des plus importants de l'industrie. Mais l'intérêt stratégique et les impératifs économiques divergent : quand les coûts d'utilisation deviennent trop élevés, même les partenaires investisseurs cherchent à contourner la dépendance. Cette dynamique pourrait accélérer la tendance des grandes entreprises tech à développer ou adapter leurs propres modèles en interne.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Anthropic modifie sa tarification pour facturer les entreprises selon leur consommation d'IA
1The Information AI 

Anthropic modifie sa tarification pour facturer les entreprises selon leur consommation d'IA

Anthropic a discrètement modifié son modèle de facturation pour les entreprises clientes de Claude, abandonnant une tarification forfaitaire au profit d'un système basé sur le volume réel d'utilisation de l'IA. Ce changement, qui n'avait pas été annoncé publiquement, signifie concrètement que les organisations dont les salariés sont des utilisateurs intensifs des outils Claude paieront désormais significativement plus cher. La décision a été mise en place au cours des dernières semaines et vise directement les clients enterprise. Cette révision tarifaire reflète la pression croissante que fait peser la popularité explosive des produits de codage assisté et d'agents IA d'Anthropic sur ses infrastructures de calcul. Plus les utilisateurs adoptent ces fonctionnalités avancées, plus le coût de traitement augmente côté serveur. En répercutant ces coûts sur les clients en fonction de leur consommation réelle, Anthropic cherche à préserver ses marges dans un contexte où la demande dépasse les prévisions initiales et où les ressources GPU restent rares et coûteuses. Ce virage intervient dans un secteur confronté à ce que les professionnels appellent un "compute crunch", une tension généralisée sur les capacités de calcul disponibles pour faire tourner des modèles d'IA de grande taille. OpenAI, Google et d'autres acteurs font face aux mêmes contraintes. La décision d'Anthropic pourrait inaugurer une tendance plus large : la fin des abonnements IA à prix fixe pour les entreprises, remplacés par des modèles à la consommation calqués sur ceux du cloud computing traditionnel.

UELes entreprises françaises et européennes abonnées à Claude Enterprise devront réévaluer leur budget IA, leurs coûts pouvant augmenter significativement selon l'intensité d'utilisation de leurs salariés.

BusinessActu
1 source
Amazon pourrait payer davantage pour la technologie d'Anthropic avec son nouveau contrat
2The Information AI 

Amazon pourrait payer davantage pour la technologie d'Anthropic avec son nouveau contrat

Anthropic a renégocié en début d'année les termes de son partenariat avec Amazon, imposant des conditions financières plus contraignantes au géant du cloud et du e-commerce pour l'utilisation de ses modèles d'IA dans ses produits. L'information, révélée par deux personnes proches des discussions, illustre le rapport de force désormais inversé entre la startup et l'un de ses premiers et plus importants bailleurs de fonds. En conséquence directe, Amazon évalue actuellement la possibilité de réduire ses coûts en se tournant vers d'autres modèles, notamment ceux d'OpenAI ou sa propre gamme Nova. Ce changement de cap est significatif pour Amazon, qui a investi plusieurs milliards de dollars dans Anthropic et intègre ses modèles Claude dans de nombreux services AWS. Si Amazon devait réduire sa dépendance à Anthropic, cela aurait des répercussions sur la stratégie IA du cloud leader, mais aussi sur les revenus d'Anthropic, dont Amazon constitue un partenaire commercial central. Pour les entreprises clientes, cela signale aussi que les tarifs des modèles frontier pourraient augmenter à mesure que les fournisseurs gagnent en maturité et en pouvoir de négociation. Anthropic s'est imposée comme l'un des acteurs incontournables de l'IA d'entreprise, concurrençant directement OpenAI sur le segment des grands comptes. Sa valorisation dépasse désormais les 60 milliards de dollars, portée par une adoption rapide de la famille Claude. Cette renégociation illustre une tendance de fond : les startups IA, longtemps dépendantes de leurs investisseurs stratégiques, commencent à reprendre la main sur leurs conditions commerciales au fur et à mesure que leur technologie devient indispensable.

UELes entreprises européennes utilisant les modèles Claude via AWS pourraient anticiper une hausse des tarifs si Anthropic généralise cette politique de renégociation à ses autres partenaires cloud.

💬 Le rapport de force a basculé. Anthropic, longtemps à la merci de ses investisseurs, impose maintenant ses tarifs à Amazon, qui lorgne du côté d'OpenAI ou de ses propres modèles Nova. C'est le signal que la phase "on investit pour garder l'accès" est terminée : quand ta techno devient indispensable, c'est toi qui dictes les règles.

BusinessActu
1 source
3The Decoder 

OpenAI réduit de moitié son abonnement Pro à 100 $ pour les gros utilisateurs de Codex, sous les tarifs d'Anthropic et Google

OpenAI restructure ses offres d'abonnement avec un nouveau plan Pro à 100 dollars par mois, soit la moitié du prix de l'ancien abonnement Pro à 200 dollars. Le changement principal concerne les utilisateurs intensifs de Codex, l'outil de génération de code d'OpenAI, qui bénéficient désormais d'un quota d'utilisation nettement supérieur à ce tarif réduit. Cette annonce positionne OpenAI directement en dessous des offres premium d'Anthropic et de Google dans la bataille des abonnements IA haut de gamme. Pour les développeurs et professionnels faisant un usage intensif de Codex, la réduction est substantielle. À 100 dollars mensuels, OpenAI rend son niveau d'accès le plus avancé accessible à un public plus large, tout en se différenciant tarifairement face à Claude Pro d'Anthropic et à Gemini Advanced de Google, dont les offres équivalentes restent plus chères ou moins généreuses en usage Codex. L'objectif est clair : attirer et fidéliser les développeurs qui constituent le coeur de l'adoption entreprise des modèles d'OpenAI. Ce mouvement s'inscrit dans une guerre des prix qui s'intensifie entre les grands acteurs de l'IA générative. OpenAI, malgré sa position de leader du marché, fait face à une concurrence croissante d'Anthropic avec ses modèles Claude et de Google avec Gemini, tous deux ayant considérablement renforcé leurs capacités de génération de code ces derniers mois. En ciblant explicitement les gros utilisateurs de Codex avec cette offre, OpenAI envoie un signal à l'ensemble de l'écosystème développeur : la compétition sur les prix est désormais aussi importante que la compétition sur les performances.

UELes développeurs français et européens utilisant Codex peuvent désormais accéder au niveau Pro d'OpenAI à 100 $/mois au lieu de 200 $, réduisant la barrière tarifaire face aux offres concurrentes d'Anthropic et Google.

BusinessOpinion
1 source
Anthropic suspend la facturation au token pour son Claude Agent SDK
4Ars Technica AI 

Anthropic suspend la facturation au token pour son Claude Agent SDK

Anthropic a fait volte-face sur une modification tarifaire majeure concernant son Claude Agent SDK. Annoncée le 13 mai dernier, cette réforme devait entrer en vigueur le 15 juin : elle prévoyait de facturer séparément l'usage du SDK d'automatisation, qu'il soit réalisé via des applications tierces ou la commande programmatique "claude -p", aux tarifs de l'API Anthropic. Chaque abonné aurait reçu un crédit mensuel équivalent au prix de son abonnement, sans bénéficier des plafonds d'utilisation hebdomadaires actuellement inclus. Lundi, Anthropic a brusquement annoncé la suspension de ce changement, maintenant le statu quo et permettant aux utilisateurs du SDK de continuer à puiser dans les limites généreuses de leur abonnement existant. Cette pause est significative car l'écart entre abonnement et tarification API est considérable. Selon une analyse citée dans l'article, les abonnés Claude Opus commencent à rentabiliser leur souscription dès deux à trois échanges quotidiens seulement, et la valeur réelle de leur forfait peut représenter plusieurs fois son coût mensuel si on la convertit en tokens API. La réforme initiale aurait donc frappé en priorité les utilisateurs intensifs et les développeurs qui s'appuient sur le SDK pour automatiser des tâches complexes via des services tiers, en augmentant substantiellement leurs coûts réels. Ce revirement illustre la tension croissante entre Anthropic et sa base d'utilisateurs avancés, au moment où le Claude Agent SDK gagne en popularité pour orchestrer des agents IA autonomes. En factualisant l'usage SDK comme de la consommation API ordinaire, Anthropic cherchait à récupérer une partie de la valeur économique capturée par des abonnés très actifs, un modèle économique difficile à tenir à grande échelle. La suspension rapide, intervenue le jour même de l'entrée en vigueur prévue, suggère que la pression de la communauté a joué un rôle, mais Anthropic n'a pas précisé si la réforme reviendra sous une forme modifiée ni à quelle échéance.

UELes développeurs et entreprises européennes utilisant le Claude Agent SDK peuvent continuer à exploiter l'outil dans les limites de leur abonnement existant, évitant une hausse substantielle des coûts qui aurait pu freiner l'adoption des agents IA autonomes.

BusinessActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic