
☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne
Amazon a mis fin à Kirorank, un classement interne qui mesurait la quantité de tokens consommés par ses employés sur Kiro, sa plateforme de développement assisté par intelligence artificielle. Conçu pour encourager l'adoption de l'IA, ce tableau de bord attribuait des scores en fonction du volume d'utilisation de l'outil, poussant les mieux classés vers le haut au fur et à mesure qu'ils généraient davantage d'interactions avec le modèle. Dave Treadwell, vice-président d'Amazon, a reconnu dans un mémo interne relayé par le Financial Times que le classement avait été créé avec de « bonnes intentions », avant d'inviter ses équipes à ne pas « utiliser l'IA simplement pour utiliser l'IA ». L'outil, décrit par Amazon comme un tableau de bord bêta non officiel, a depuis été abandonné. L'entreprise indique vouloir désormais suivre des indicateurs plus qualitatifs, comme les « déploiements normalisés », qui mesurent si le code produit grâce à l'IA est réellement utile et mis en production.
Le problème est apparu rapidement : pour grimper dans le classement, certains employés avaient commencé à lancer des agents IA en boucle sur des tâches sans valeur ajoutée, une pratique baptisée « tokenmaxxing ». Cette optimisation artificielle des scores génère une consommation de ressources de calcul réelle, donc des coûts réels. À l'échelle d'une entreprise de la taille d'Amazon, où des milliers de développeurs sont concernés, la facture peut devenir significative. Le phénomène illustre un problème classique de management par les métriques : dès qu'un indicateur devient un objectif, il cesse de mesurer ce qu'il était censé mesurer. En l'occurrence, le volume de tokens ne dit rien de la qualité du travail produit, et peut même devenir contra-productif s'il incite à générer de l'activité artificielle plutôt qu'à résoudre de vrais problèmes.
Amazon reste néanmoins sous pression pour accélérer l'intégration de l'IA dans ses processus internes. L'entreprise s'est fixé un objectif ambitieux : que 80 % de ses développeurs utilisent ces outils chaque semaine. Ce contexte d'adoption forcée, combiné à des investissements colossaux, dont 200 milliards de dollars consacrés aux infrastructures pour la seule année 2026, crée une tension entre la volonté d'afficher des chiffres d'adoption élevés et la nécessité de s'assurer que ces usages créent de la valeur concrète. L'épisode Kirorank rappelle que déployer l'IA en entreprise ne se résume pas à compter des tokens ou des utilisateurs actifs, mais exige de repenser entièrement la façon dont on mesure la productivité à l'ère des modèles de langage.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




