Aller au contenu principal
AT&T limite l'usage de l'IA de certains salariés avec l'essor du "tokenminimizing
BusinessThe Information AI43min· 1 min de lecture

AT&T limite l'usage de l'IA de certains salariés avec l'essor du "tokenminimizing

Source originale ↗·

AT&T a commencé à restreindre l'accès de certains employés à GitHub Copilot de Microsoft, selon une source interne à l'entreprise. Meta a également mis en place des limites sur les dépenses d'IA de ses salariés pour des services comme ceux d'Anthropic et d'autres fournisseurs. Uber et Walmart ont eux aussi plafonné l'utilisation des outils d'IA dédiés au développement logiciel, selon Bloomberg. Amazon, de son côté, a supprimé son classement interne qui établissait un palmarès des employés selon leur niveau de consommation d'IA. Un phénomène suffisamment généralisé pour que l'on parle désormais de "tokenminimizing", en opposition au "tokenmaxxing" qui régnait encore il y a quelques mois.

Ce virage marque un tournant significatif dans la façon dont les grandes entreprises américaines perçoivent l'IA au quotidien. Après une période d'enthousiasme débridé où les outils génératifs étaient présentés comme des leviers de productivité illimités, les directions financières font face à une réalité budgétaire concrète : les coûts d'inférence s'accumulent rapidement à l'échelle de milliers d'employés, et le retour sur investissement reste difficile à mesurer. Pour les salariés, ces restrictions signifient moins d'autonomie dans le choix des outils, et potentiellement un ralentissement de certains workflows devenus dépendants de l'assistance IA.

Il y a quelques mois à peine, Meta encourageait une dynamique inverse : ses employés se livraient à une compétition informelle pour consommer le plus de tokens possible, dans une logique d'"utilisation maximale" des capacités offertes. Ce renversement brutal illustre la tension croissante entre les promesses de productivité portées par les éditeurs d'IA et la pression exercée par les investisseurs sur les coûts opérationnels des Fortune 500, d'Uber à Snowflake en passant par ServiceNow. Le PDG de Box, Aaron Levie, s'est démarqué en affirmant n'avoir jamais mis en place de classements ni encouragé le tokenmaxxing. Sa prudence originelle ressemble aujourd'hui à de la sagesse anticipée.

Impact France/UE

Les grandes entreprises européennes dotées de budgets IA importants pourraient être confrontées aux mêmes pressions sur les coûts d'inférence, bien qu'aucun acteur français ou européen ne soit directement cité dans cet article.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Les salariés de Meta se disputent le statut de « légende des tokens » en IA
1The Information AI 

Les salariés de Meta se disputent le statut de « légende des tokens » en IA

Chez Meta Platforms, un classement interne baptisé "Claudeonomics" transforme l'utilisation de l'intelligence artificielle en compétition entre employés. Mis en place par un salarié de l'entreprise sur son intranet à partir de données internes, ce tableau de bord mesure le nombre de tokens, les unités de données traitées par les modèles d'IA, consommés par chaque utilisateur. Les 250 plus gros consommateurs parmi les quelque 85 000 employés de Meta y figurent, avec des titres honorifiques à la clé : "Session Immortal" pour les plus assidus, et "Token Legend" pour les véritables champions de l'outil. Le nom "Claudeonomics" est une référence directe à Claude, le modèle phare d'Anthropic, le concurrent d'OpenAI dont Meta a vraisemblablement adopté les outils en interne. Ce type de mécanisme de gamification révèle une tendance de fond dans les grandes entreprises tech : encourager l'adoption massive des outils d'IA par les employés en jouant sur la compétition et la reconnaissance sociale. Pour Meta, qui investit massivement dans l'IA générative, afficher des statistiques d'usage aussi élevées est aussi un signal fort sur la culture interne de l'entreprise. Cette initiative s'inscrit dans un contexte où les géants de la tech cherchent à mesurer et accélérer l'intégration de l'IA dans leurs workflows quotidiens. Meta, qui développe ses propres modèles Llama tout en recourant à des outils tiers, fait face à la même question que l'ensemble de l'industrie : comment transformer des outils puissants en réflexes productifs pour des dizaines de milliers de salariés ? Les classements internes, aussi anecdotiques qu'ils paraissent, sont l'un des leviers expérimentés.

BusinessOpinion
1 source
☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains
2Next INpact 

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

Les grandes entreprises technologiques font face à une équation économique qui commence à gripper sérieusement leurs ambitions d'IA : la facturation à l'usage des agents IA, calculée en tokens et non plus en abonnements forfaitaires, rend ces systèmes plus onéreux que les employés humains qu'ils sont censés remplacer ou assister. Le CTO d'Uber, Praveen Neppalli Naga, a reconnu avoir épuisé la totalité de son budget IA 2026 en seulement quatre mois. Bryan Catanzaro, vice-président en charge de l'apprentissage profond appliqué chez Nvidia, est encore plus direct : pour son équipe, le coût de la puissance de calcul dépasse désormais celui des salaires. Microsoft, après avoir encouragé en décembre dernier des milliers de ses développeurs à utiliser Claude Code d'Anthropic, vient d'annuler ces licences et les contraint à migrer vers GitHub Copilot CLI. Ce même GitHub Copilot, qui avait limité fin avril les nouveaux abonnements individuels, basculera en juin vers une facturation indexée sur la consommation réelle de tokens. Cette pression économique a engendré un phénomène pervers baptisé « tokenmaxxing » : des employés génèrent artificiellement de l'activité IA pour gonfler leurs statistiques de consommation, moins pour produire du code utile que pour paraître surproductifs aux yeux de leur hiérarchie. Amazon a fixé comme objectif que 80 % de ses développeurs utilisent l'IA chaque semaine et suit leur consommation de tokens. Meta est allé plus loin encore, avec un tableau de bord interne attribuant le statut de « Token Legend » aux plus grands consommateurs. Ce que ces pratiques révèlent, c'est que les métriques de tokens sont devenues des indicateurs de performance managériale avant d'être des mesures de valeur créée. La question de fond est structurelle : les modèles agentiques consomment beaucoup plus de tokens par tâche que les modèles classiques, et cette intensité ne sera pas compensée par la baisse des coûts unitaires. Un rapport Gartner estime que le coût d'inférence sur un LLM sophistiqué pourrait chuter de 90 % d'ici 2030, mais prévoit néanmoins que le coût total de l'IA continuera d'augmenter si la consommation progresse plus vite que la déflation tarifaire. Jensen Huang, PDG de Nvidia, imaginait récemment un futur où 100 agents IA travailleraient aux côtés de chaque employé humain de son entreprise, une vision qui semble économiquement intenable dans le modèle de facturation actuel. L'industrie se retrouve donc devant un choix structurant : soit les prix s'effondrent suffisamment vite, soit les entreprises doivent revoir radicalement leur usage de l'IA agentique, sous peine de financer des dépenses dont le retour reste difficile à démontrer.

UELes entreprises européennes qui adoptent des agents IA à grande échelle sont exposées aux mêmes pressions économiques liées à la facturation à l'usage, remettant en question la viabilité budgétaire de leurs projets d'IA agentique.

💬 Uber qui épuise son budget IA en quatre mois, Nvidia qui dit que le compute dépasse les salaires : c'est pas un bug, c'est le modèle. Les agents consomment structurellement 10 à 100 fois plus de tokens qu'un chat classique, et aucune baisse de prix unitaire ne rattrapera ça avant 2-3 ans. Le tokenmaxxing chez Amazon et Meta, des gens qui gonflent leur conso pour paraître productifs sur un dashboard, c'est juste le signe qu'on a mis la mauvaise métrique au centre.

BusinessOpinion
1 source
Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?
3SCMP Tech 

Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?

Les entreprises chinoises d'intelligence artificielle s'imposent progressivement comme fournisseurs majeurs de ce que les analystes appellent des "exportations de tokens" sur le marché mondial. Selon des données couvrant la période du 18 mars au 18 avril 2026, les modèles chinois représentaient quatre des dix modèles les plus consommés en tokens sur OpenRouter, une place de marché de référence pour les développeurs. Cette présence dans le top 10 mondial illustre une percée concrète dans les usages réels, au-delà des seuls benchmarks techniques. L'enjeu dépasse la simple compétition technologique. Les tokens consommés via des modèles comme DeepSeek ou Qwen représentent une forme d'influence économique et stratégique nouvelle : chaque requête traitée par un modèle chinois génère des données d'usage, fidélise des développeurs et ancre une infrastructure logicielle dans les flux numériques mondiaux. Pour l'industrie tech mondiale, cela signifie que la domination américaine sur l'outillage IA des développeurs n'est plus acquise, et que les éditeurs comme OpenAI ou Anthropic font désormais face à une concurrence directe sur les marchés émergents et auprès des développeurs indépendants. Ce phénomène s'inscrit dans un contexte de montée en puissance accélérée des modèles chinois depuis la publication de DeepSeek-R1 début 2025, qui avait démontré qu'un modèle très compétitif pouvait être entraîné à coût réduit. La demande domestique en Chine croît également fortement, ce qui renforce la capacité des acteurs locaux à investir en R&D et à baisser leurs prix à l'export, une dynamique que Washington surveille de près dans un contexte de restrictions sur les semi-conducteurs.

UELes développeurs européens indépendants sont directement exposés à cette concurrence tarifaire, les modèles chinois comme DeepSeek ou Qwen s'imposant comme alternatives compétitives aux outils américains sur des plateformes comme OpenRouter.

BusinessOpinion
1 source
Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?
4Le Big Data 

Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?

Dans certaines entreprises, la facture mensuelle liée à l'intelligence artificielle dépasse désormais celle des salaires humains. C'est le constat documenté par Axios dans une enquête publiée fin avril 2026, qui révèle que le coût du traitement des requêtes IA excède, dans certains cas, celui des équipes en chair et en os. Bryan Catanzaro, responsable chez Nvidia, a confirmé le phénomène pour ses propres équipes. Le New York Times rapporte que certains utilisateurs intensifs atteignent plus de 150 000 dollars de dépenses mensuelles en tokens, certains ingénieurs dépensant davantage en usage d'IA qu'ils ne touchent en salaire. Chez Uber, des équipes utilisant des outils comme Claude Code ont déjà épuisé leur budget annuel d'IA bien avant la fin de l'exercice, selon The Information. Le phénomène a même un nom dans les milieux tech : le "tokenmaxxing", pratique où les ingénieurs maximisent délibérément leur consommation de tokens, parfois comme indicateur implicite de performance. Ce glissement remet en cause la promesse fondatrice de l'IA en entreprise : réduire les coûts grâce à l'automatisation. L'équation est plus complexe que prévu. Chaque requête envoyée à un modèle consomme des tokens facturés, et lorsque les agents s'exécutent en parallèle sans supervision directe, les volumes explosent. La structure de coût des entreprises se transforme en profondeur : les dépenses, autrefois fixes et prévisibles via les ressources humaines, deviennent variables, dépendantes de l'usage, et donc difficiles à piloter. Pour les organisations qui n'ont pas mis en place de garde-fous, la dérive peut être rapide. Chez Meta, l'utilisation de l'IA est désormais intégrée dans l'évaluation des performances des employés, ce qui pousse mécaniquement à une consommation accrue. Google et Microsoft adoptent des dynamiques similaires, une grande part du code produit étant déjà générée par des modèles. Cette situation profite directement aux fournisseurs de modèles. OpenAI et Anthropic bénéficient de la hausse de consommation, Anthropic ayant d'ailleurs relevé ses tarifs récemment. Les investisseurs parient sur la capacité des modèles les plus efficaces à capter davantage de clients en offrant un meilleur ratio performance-coût. Du côté des entreprises consommatrices, les réponses restent expérimentales. Jensen Huang, PDG de Nvidia, a évoqué l'idée de distribuer des quotas de tokens aux employés, à l'image d'une enveloppe salariale dédiée à l'IA, ce qui transformerait l'accès à la puissance de calcul en véritable avantage compétitif individuel. Le compute est en passe de devenir une ligne budgétaire stratégique aussi sensible que la masse salariale, obligeant les directions financières à repenser leur manière de gouverner ces outils avant que la facture ne devienne incontrôlable.

UELes entreprises européennes adoptant des agents IA à grande échelle sont exposées aux mêmes dérives budgétaires documentées aux États-Unis, sans cadre de gouvernance des coûts IA encore établi au niveau sectoriel ou réglementaire.

BusinessOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic