Les workflows IA de Walmart face aux réalités du bilan financier
Walmart a discrètement mis fin à l'accès illimité de ses 2,1 millions d'employés à Code Puppy, son assistant interne propulsé par un grand modèle de langage. Jusqu'ici encouragés à utiliser l'outil sans restriction pour des tâches comme l'analyse de feuilles de calcul, la création de présentations ou d'autres activités bureautiques automatisables, les salariés se voient désormais attribuer un quota fixe de tokens, l'unité de mesure qui détermine combien ils peuvent solliciter le modèle. Ce changement de politique, intervenu courant 2026, est une mesure de contrôle des coûts directement liée à la transition du secteur vers une facturation à l'usage, abandonnant le modèle d'abonnement à prix fixe qui offrait un accès quasi illimité à l'inférence LLM.
Ce virage illustre une tension croissante au sein des grandes entreprises entre les gains de productivité annoncés et le coût réel pour les obtenir. À l'échelle de Walmart, même une utilisation modeste par employé génère des dépenses considérables, d'autant que certains comportements amplifient la facture : le phénomène dit du "token maxxing", encouragé jusqu'en avril dernier par un associé de Sequoia Capital dans le Wall Street Journal, a poussé des salariés à multiplier les requêtes complexes pour performer sur des tableaux de bord internes célébrant les meilleurs utilisateurs d'IA. Les modèles de raisonnement récursif ("thinking models"), plus coûteux car ils consomment davantage de tokens pour traiter les entrées de manière introspective, aggravent encore la note. Les workflows multi-agents, où des boucles itératives entre plusieurs agents sont relancées pour affiner un résultat, deviennent eux aussi mesurables en argent sonnant et trébuchant.
Walmart n'est pas seul dans cette situation. Uber a révélé avoir consommé en quatre mois son budget IA prévu pour toute l'année 2026, signe que la nouvelle structure tarifaire des fournisseurs bouleverse les prévisions des entreprises utilisatrices. Anthropic et OpenAI ont déjà basculé leurs plans entreprise haut de gamme vers une facturation à l'usage, et Microsoft a commencé à facturer GitHub Copilot au 1er juin. En imposant des limites de tokens par employé, en publiant des guides sur le choix du bon outil selon la tâche, et en réservant les modèles frontière aux cas d'usage qui le justifient vraiment, Walmart cherche à poser les bases d'un vrai calcul de retour sur investissement, une étape que beaucoup d'entreprises ayant déployé l'IA à grande échelle n'ont pas encore franchie.
La bascule vers la facturation à l'usage d'Anthropic, OpenAI et Microsoft/GitHub Copilot (au 1er juin) s'applique également aux entreprises européennes, qui devront revoir leurs budgets IA et instaurer des politiques de gouvernance des tokens sous peine de dépassements comparables à ceux de Walmart et Uber.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



