BusinessNext INpact · 1 juin 2026, 08:31· 2 min de lecture

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne

Amazon a mis fin à Kirorank, un classement interne qui mesurait la quantité de tokens consommés par ses employés sur Kiro, sa plateforme de développement assisté par intelligence artificielle. Conçu pour encourager l'adoption de l'IA, ce tableau de bord attribuait des scores en fonction du volume d'utilisation de l'outil, poussant les mieux classés vers le haut au fur et à mesure qu'ils généraient davantage d'interactions avec le modèle. Dave Treadwell, vice-président d'Amazon, a reconnu dans un mémo interne relayé par le Financial Times que le classement avait été créé avec de « bonnes intentions », avant d'inviter ses équipes à ne pas « utiliser l'IA simplement pour utiliser l'IA ». L'outil, décrit par Amazon comme un tableau de bord bêta non officiel, a depuis été abandonné. L'entreprise indique vouloir désormais suivre des indicateurs plus qualitatifs, comme les « déploiements normalisés », qui mesurent si le code produit grâce à l'IA est réellement utile et mis en production.

Le problème est apparu rapidement : pour grimper dans le classement, certains employés avaient commencé à lancer des agents IA en boucle sur des tâches sans valeur ajoutée, une pratique baptisée « tokenmaxxing ». Cette optimisation artificielle des scores génère une consommation de ressources de calcul réelle, donc des coûts réels. À l'échelle d'une entreprise de la taille d'Amazon, où des milliers de développeurs sont concernés, la facture peut devenir significative. Le phénomène illustre un problème classique de management par les métriques : dès qu'un indicateur devient un objectif, il cesse de mesurer ce qu'il était censé mesurer. En l'occurrence, le volume de tokens ne dit rien de la qualité du travail produit, et peut même devenir contra-productif s'il incite à générer de l'activité artificielle plutôt qu'à résoudre de vrais problèmes.

Amazon reste néanmoins sous pression pour accélérer l'intégration de l'IA dans ses processus internes. L'entreprise s'est fixé un objectif ambitieux : que 80 % de ses développeurs utilisent ces outils chaque semaine. Ce contexte d'adoption forcée, combiné à des investissements colossaux, dont 200 milliards de dollars consacrés aux infrastructures pour la seule année 2026, crée une tension entre la volonté d'afficher des chiffres d'adoption élevés et la nécessité de s'assurer que ces usages créent de la valeur concrète. L'épisode Kirorank rappelle que déployer l'IA en entreprise ne se résume pas à compter des tokens ou des utilisateurs actifs, mais exige de repenser entièrement la façon dont on mesure la productivité à l'ère des modèles de langage.

Dans nos dossiers

Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1FrenchWeb

Comment l’IA transforme le sourcing, l’analyse et le pilotage des participations dans les fonds d’investissement

L'intelligence artificielle s'impose progressivement dans les fonds d'investissement, mais de façon inégale. Si la quasi-totalité des investisseurs utilisent désormais des outils comme ChatGPT, Claude ou Gemini pour accélérer leurs tâches quotidiennes, rédaction de mémos, synthèse de documents, veille sectorielle, très peu ont franchi le cap de l'intégration de l'IA dans leurs processus décisionnels structurels. Les premiers fonds à avoir fait ce saut observent des gains mesurables : des due diligences réalisées en quelques jours plutôt qu'en plusieurs semaines, un sourcing de deals élargi à des centaines de signaux simultanés, et un suivi de portefeuille plus réactif. L'enjeu est considérable pour une industrie où l'avantage informationnel est central. Un fonds capable d'identifier et d'analyser une opportunité deux fois plus vite qu'un concurrent dispose d'un avantage structurel dans des marchés où les meilleures transactions se closent en quelques semaines. Pour les équipes de taille réduite, la norme dans le capital-risque européen, l'IA agit comme un multiplicateur de capacité, permettant à un analyste de traiter un volume de données autrefois réservé aux grandes maisons. Cette transformation s'inscrit dans un contexte de pression croissante sur les rendements et de multiplication des données disponibles sur les startups et les marchés. Les grandes plateformes comme PitchBook, Dealroom ou Crunchbase intègrent déjà des fonctionnalités IA natives. Les fonds les plus avancés construisent en parallèle leurs propres outils propriétaires, créant un fossé naissant entre early adopters et suiveurs qui pourrait, à terme, redéfinir les hiérarchies du secteur.

UELes fonds de capital-risque européens, souvent de taille réduite, pourraient gagner en compétitivité en adoptant l'IA pour accélérer leurs due diligences et leur sourcing, à mesure que le fossé entre early adopters et suiveurs se creuse.

BusinessOutil

1 source

2The Decoder

Des ingénieurs Amazon distilleraient les modèles Anthropic pour réduire les coûts avant la nouvelle tarification par token

Des ingénieurs d'Amazon sont en train de distiller les modèles d'Anthropic pour en créer des versions plus légères et moins coûteuses, destinées à un usage interne. Cette initiative intervient avant un changement de modèle tarifaire prévu pour l'an prochain : Amazon paiera alors ses accès aux modèles d'Anthropic à la consommation de tokens, et non plus à l'heure de calcul. Selon les informations rapportées par The Decoder, cette transition pourrait faire grimper significativement la facture pour le géant du e-commerce, qui utilise massivement ces modèles dans ses propres outils et services. La distillation de modèles est une technique qui consiste à entraîner un modèle plus compact à imiter le comportement d'un modèle plus grand, en reproduisant ses sorties plutôt que ses paramètres internes. Le résultat est un modèle moins puissant mais nettement moins gourmand en ressources. Pour Amazon, qui déploie des capacités d'IA à grande échelle en interne, réduire le coût par requête représente un enjeu financier considérable. La société explore également des alternatives, dont les modèles d'OpenAI, ce qui suggère une volonté de ne pas se retrouver trop dépendante d'un seul fournisseur. Cette situation révèle une tension croissante entre les grands hyperscalers et leurs fournisseurs de modèles. Amazon a investi plus de quatre milliards de dollars dans Anthropic depuis 2023, faisant du partenariat l'un des plus importants de l'industrie. Mais l'intérêt stratégique et les impératifs économiques divergent : quand les coûts d'utilisation deviennent trop élevés, même les partenaires investisseurs cherchent à contourner la dépendance. Cette dynamique pourrait accélérer la tendance des grandes entreprises tech à développer ou adapter leurs propres modèles en interne.

BusinessOpinion

1 source

3The Decoder

Claude Sonnet 5 confirme la tendance d'Anthropic à masquer des hausses de prix via des tarifs par token inchangés

Claude Sonnet 5, le dernier modèle d'Anthropic, se classe cinquième de l'Artificial Analysis Intelligence Index avec un score de 53 points, et surpasse même le modèle plus onéreux Opus 4.8 sur certaines tâches agentiques. Problème : le modèle consomme environ 40 % de tokens en plus par tâche que son prédécesseur, ce qui fait quasiment doubler le coût réel pour les utilisateurs, alors même que les tarifs affichés par token restent identiques. Selon The Decoder, cette pratique s'inscrit dans une tendance récurrente chez Anthropic, qui masquerait ainsi des hausses de prix derrière des grilles tarifaires en apparence inchangées. Cette opacité tarifaire a des conséquences concrètes pour les entreprises et développeurs qui intègrent Claude dans leurs produits : budgéter l'usage d'un modèle devient difficile lorsque le coût réel par tâche grimpe sans que le prix unitaire ne bouge officiellement. Pour les équipes qui optimisent leurs dépenses d'IA générative, cela signifie qu'un modèle apparemment plus performant peut en réalité coûter bien plus cher à l'usage, remettant en question les comparatifs basés uniquement sur les prix par token. Cette situation fragilise la confiance des clients professionnels dans la lisibilité des offres des fournisseurs de modèles. Ce phénomène s'inscrit dans une dynamique plus large où les laboratoires d'IA, poussés par l'explosion des coûts de calcul et d'entraînement, cherchent à maintenir des prix catalogue attractifs tout en captant davantage de valeur via la consommation réelle de tokens, notamment sur les tâches agentiques complexes qui multiplient les étapes de raisonnement. Reste à savoir si la pression concurrentielle, notamment face à OpenAI et Google, poussera Anthropic vers davantage de transparence sur les coûts réels, ou si cette stratégie de tarification perdurera à mesure que les modèles gagnent en complexité et en gourmandise en tokens.

UELes entreprises europeennes utilisant l'API Claude via leurs produits devront revoir leurs budgets, le cout reel par tache augmentant sans hausse affichee des tarifs par token.

💬 Claude Sonnet 5 qui bouffe 40% de tokens en plus pour un même prix affiché, ça n'a rien d'un hasard technique. C'est une stratégie tarifaire classique : tu gardes la grille inchangée sur le papier, tu laisses le modèle raisonner plus longtemps, et la facture grimpe toute seule côté client. Selon Le Fil IA, la vraie inflation des prix de l'IA ne se lit plus sur les tarifs par token, mais dans le nombre de tokens que chaque tâche consomme désormais.

BusinessOpinion

1 source

4Next INpact

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

OpenAI et Anthropic étudient sérieusement une réduction du prix des tokens, selon des informations rapportées par le Wall Street Journal. Sam Altman a lui-même reconnu lors d'un événement public que le coût du token constituait un « gros problème », affirmant qu'OpenAI cherchait des moyens de permettre à ses clients « d'en faire plus tout en dépensant moins ». Le patron d'OpenAI anticiperait notamment une baisse des prix chez son rival Anthropic, dont l'outil Claude Code est devenu un incontournable dans de nombreuses équipes de développement. Pour les entreprises, chaque requête adressée à GPT ou Claude génère une consommation de tokens qui s'accumule rapidement sur les factures : selon l'analyste Ed Zitron, les utilisateurs peuvent actuellement dépenser entre 8 et 13,50 dollars pour chaque dollar de revenus d'abonnement encaissés par les labos. Le directeur technique d'Uber a d'ailleurs témoigné avoir épuisé son budget IA annuel en seulement quatre mois. Une baisse des prix serait une excellente nouvelle pour les entreprises dont les coûts d'infrastructure IA explosent au rythme de l'adoption, mais elle soulève une contradiction majeure : ni OpenAI ni Anthropic ne sont encore rentables. Les revenus générés par chaque token facturé peinent à couvrir les coûts colossaux des centres de données, des puces Nvidia et du développement continu de nouveaux modèles. Lancer une guerre tarifaire dans ce contexte repousserait encore l'horizon de la rentabilité pour les deux entreprises qui se préparent à entrer en Bourse. Les clients bénéficieraient immédiatement de marges réduites, mais les investisseurs, eux, attendraient encore. La bataille se joue également sur le terrain des outils de développement : Claude Code a pris de l'avance dans les usages professionnels, forçant OpenAI à riposter avec Codex, en position de retard. C'est précisément parce que ces outils sont devenus des postes de dépense significatifs dans les budgets tech que la question du prix du token est devenue stratégique. La baisse des prix de l'inférence suit une tendance de fond depuis 2023, tirée par la concurrence avec des acteurs comme Google et les fournisseurs open source. Mais si OpenAI et Anthropic s'alignent mutuellement à la baisse sans se différencier sur d'autres critères, ils risquent de transformer leurs modèles en commodités interchangeables, où seul le tarif compte. La prochaine étape sera de voir si l'un des deux franchit le premier le pas, entraînant l'autre dans une spirale baissière difficile à arrêter.

UEUne baisse des prix des tokens réduirait directement les coûts d'infrastructure IA des entreprises et startups européennes dépendantes des APIs OpenAI et Anthropic.

💬 Que ça baisse enfin, personne va s'en plaindre, et le CTO d'Uber qui a épuisé son budget IA en quatre mois dit tout sur l'urgence. Le vrai risque, c'est qu'ils s'alignent l'un sur l'autre sans rien d'autre à offrir, et que leurs modèles finissent par ne se distinguer que par le tarif. C'est là que Google et l'open source attendent.

BusinessOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic