Aller au contenu principal
Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?
BusinessLe Big Data1h

Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?

Résumé IASource uniqueImpact UE
Source originale ↗·

Dans certaines entreprises, la facture mensuelle liée à l'intelligence artificielle dépasse désormais celle des salaires humains. C'est le constat documenté par Axios dans une enquête publiée fin avril 2026, qui révèle que le coût du traitement des requêtes IA excède, dans certains cas, celui des équipes en chair et en os. Bryan Catanzaro, responsable chez Nvidia, a confirmé le phénomène pour ses propres équipes. Le New York Times rapporte que certains utilisateurs intensifs atteignent plus de 150 000 dollars de dépenses mensuelles en tokens, certains ingénieurs dépensant davantage en usage d'IA qu'ils ne touchent en salaire. Chez Uber, des équipes utilisant des outils comme Claude Code ont déjà épuisé leur budget annuel d'IA bien avant la fin de l'exercice, selon The Information. Le phénomène a même un nom dans les milieux tech : le "tokenmaxxing", pratique où les ingénieurs maximisent délibérément leur consommation de tokens, parfois comme indicateur implicite de performance.

Ce glissement remet en cause la promesse fondatrice de l'IA en entreprise : réduire les coûts grâce à l'automatisation. L'équation est plus complexe que prévu. Chaque requête envoyée à un modèle consomme des tokens facturés, et lorsque les agents s'exécutent en parallèle sans supervision directe, les volumes explosent. La structure de coût des entreprises se transforme en profondeur : les dépenses, autrefois fixes et prévisibles via les ressources humaines, deviennent variables, dépendantes de l'usage, et donc difficiles à piloter. Pour les organisations qui n'ont pas mis en place de garde-fous, la dérive peut être rapide. Chez Meta, l'utilisation de l'IA est désormais intégrée dans l'évaluation des performances des employés, ce qui pousse mécaniquement à une consommation accrue. Google et Microsoft adoptent des dynamiques similaires, une grande part du code produit étant déjà générée par des modèles.

Cette situation profite directement aux fournisseurs de modèles. OpenAI et Anthropic bénéficient de la hausse de consommation, Anthropic ayant d'ailleurs relevé ses tarifs récemment. Les investisseurs parient sur la capacité des modèles les plus efficaces à capter davantage de clients en offrant un meilleur ratio performance-coût. Du côté des entreprises consommatrices, les réponses restent expérimentales. Jensen Huang, PDG de Nvidia, a évoqué l'idée de distribuer des quotas de tokens aux employés, à l'image d'une enveloppe salariale dédiée à l'IA, ce qui transformerait l'accès à la puissance de calcul en véritable avantage compétitif individuel. Le compute est en passe de devenir une ligne budgétaire stratégique aussi sensible que la masse salariale, obligeant les directions financières à repenser leur manière de gouverner ces outils avant que la facture ne devienne incontrôlable.

Impact France/UE

Les entreprises européennes adoptant des agents IA à grande échelle sont exposées aux mêmes dérives budgétaires documentées aux États-Unis, sans cadre de gouvernance des coûts IA encore établi au niveau sectoriel ou réglementaire.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

OpenAI révèle pourquoi il a vraiment tué Sora (ce n’est pas ce que vous croyez)
1Le Big Data 

OpenAI révèle pourquoi il a vraiment tué Sora (ce n’est pas ce que vous croyez)

OpenAI a annoncé le 24 mars 2026 la fermeture de Sora, son réseau social entièrement propulsé par l'intelligence artificielle, moins d'un an après son lancement. L'application avait pourtant connu un démarrage fulgurant : près d'un million de téléchargements et une place parmi les plus populaires de l'App Store aux États-Unis. Lancée en parallèle du modèle vidéo Sora 2, la plateforme offrait une expérience sociale complète — génération de vidéos par IA, publication, partage, likes, commentaires et remixage des créations d'autres utilisateurs. Son interface, inspirée de TikTok et Instagram, enchaînait des vidéos réalistes mais jamais totalement convaincantes, provoquant ce malaise bien connu théorisé par Masahiro Mori sous le nom de « vallée de l'étrange ». Malgré des performances comparables à celles de Gemini et son modèle Veo 3, les vidéos trahissaient parfois leur origine artificielle : incohérences visuelles, mouvements erratiques, artefacts sonores. La fermeture s'explique par une équation économique intenable. Selon TechCrunch, faire tourner Sora coûtait environ un million de dollars par jour, pour des revenus mensuels estimés à seulement 367 000 dollars. Contrairement à ChatGPT, massivement adopté dans les entreprises, Sora restait cantonné au divertissement — un segment nettement moins rentable. Mais au-delà des finances, le projet s'est heurté à un problème de désinformation structurel. OpenAI avait intégré un filigrane pour signaler les vidéos générées par IA, mais des utilisateurs ont rapidement trouvé des moyens de le supprimer. Une fois effacé, il devenait quasi impossible de distinguer une vraie vidéo d'une création artificielle. Le potentiel de manipulation — déjà amplifié par la nature virale du réseau social — rendait la plateforme particulièrement exposée aux abus à grande échelle. La trajectoire de Sora illustre les tensions profondes auxquelles se confrontent les grandes entreprises d'IA en tentant de combiner génération de contenu synthétique et dynamiques de réseau social. Le modèle économique des plateformes sociales repose sur le volume et la publicité, deux logiques difficilement compatibles avec le coût astronomique de l'inférence vidéo. OpenAI, qui cherche à rentabiliser ses investissements colossaux avant une introduction en Bourse attendue, ne pouvait se permettre de subventionner indéfiniment un service déficitaire. L'arrêt de Sora ne signifie pas l'abandon du modèle vidéo — l'API restera accessible — mais marque la fin d'une tentative risquée de transformer une capacité technique spectaculaire en produit grand public viable. D'autres acteurs, Google et Meta en tête, observeront attentivement cet échec avant de s'aventurer sur le même terrain.

BusinessOpinion
1 source
C’est confirmé : OpenAI met toute sa puissance sur une IA qui va changer le monde
2Le Big Data 

C’est confirmé : OpenAI met toute sa puissance sur une IA qui va changer le monde

OpenAI a décidé de mettre en pause, voire d'abandonner définitivement, le développement de Sora, son générateur de vidéos par IA, pour réorienter l'intégralité de ses ressources de calcul vers une nouvelle génération de modèles d'intelligence artificielle. L'annonce a été confirmée officiellement dans la documentation interne d'OpenAI début avril 2026. Sam Altman, PDG de l'entreprise, a déclaré publiquement : "Il se passe quelque chose de très important. Je ne m'attendais pas, il y a trois ou six mois, à être là où nous en sommes aujourd'hui." Ce pivot stratégique rappelle directement celui opéré lors du tournant vers GPT-3, quand OpenAI avait déjà sacrifié plusieurs projets prometteurs en robotique pour concentrer ses moyens sur un pari jugé plus structurant. Cette fois, l'enjeu est encore plus ambitieux : il s'agit de développer des agents autonomes capables d'exécuter des tâches complexes, de prendre des décisions et de s'intégrer dans des flux de travail à grande échelle. La décision révèle une réalité fondamentale du secteur : les ressources de calcul sont un goulot d'étranglement absolu. Poursuivre Sora en parallèle aurait mobilisé une part trop importante de cette infrastructure au détriment des projets jugés prioritaires. Pour les entreprises, les conséquences pourraient être considérables : Altman évoque l'émergence d'un écosystème entier de "chercheurs et entreprises spécialisées dans l'automatisation", construits autour de ces nouveaux agents. Ces systèmes ne se contenteraient plus d'assister les utilisateurs, mais automatiseraient des processus entiers, de la recherche à l'exécution opérationnelle. La frustration exprimée par certains développeurs sur les forums communautaires d'OpenAI illustre bien que Sora suscitait des attentes réelles, mais la logique de concentration l'a emporté sur celle de la diversification. Ce virage s'inscrit dans une dynamique plus large de course aux ressources qui structure désormais toute l'industrie de l'IA. Comme le résume Altman lui-même : "Tout repose sur le calcul." Les modèles les plus performants exigent des infrastructures massives, des centres de données spécialisés et des investissements colossaux, ce qui crée une guerre des ressources entre les grands acteurs. OpenAI, face à Microsoft, Google DeepMind et Anthropic, fait le choix de concentrer ses efforts plutôt que de les disperser, quitte à abandonner des projets pourtant aboutis. Les avancées internes des derniers mois ont visiblement été si rapides que même l'équipe dirigeante ne les anticipait pas, suggérant un saut qualitatif potentiellement significatif. Si les prochains modèles tiennent leurs promesses, on pourrait assister à un changement de paradigme dans la manière dont individus et organisations interagissent avec l'IA, non plus comme un outil d'assistance, mais comme un acteur autonome dans la chaîne de décision.

UELa réorientation vers les agents autonomes va intensifier la pression sur les entreprises européennes pour adapter leurs workflows et relance le débat sur la souveraineté numérique face à la concentration des ressources de calcul chez les géants américains.

BusinessOpinion
1 source
Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?
3SCMP Tech 

Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?

Les entreprises chinoises d'intelligence artificielle s'imposent progressivement comme fournisseurs majeurs de ce que les analystes appellent des "exportations de tokens" sur le marché mondial. Selon des données couvrant la période du 18 mars au 18 avril 2026, les modèles chinois représentaient quatre des dix modèles les plus consommés en tokens sur OpenRouter, une place de marché de référence pour les développeurs. Cette présence dans le top 10 mondial illustre une percée concrète dans les usages réels, au-delà des seuls benchmarks techniques. L'enjeu dépasse la simple compétition technologique. Les tokens consommés via des modèles comme DeepSeek ou Qwen représentent une forme d'influence économique et stratégique nouvelle : chaque requête traitée par un modèle chinois génère des données d'usage, fidélise des développeurs et ancre une infrastructure logicielle dans les flux numériques mondiaux. Pour l'industrie tech mondiale, cela signifie que la domination américaine sur l'outillage IA des développeurs n'est plus acquise, et que les éditeurs comme OpenAI ou Anthropic font désormais face à une concurrence directe sur les marchés émergents et auprès des développeurs indépendants. Ce phénomène s'inscrit dans un contexte de montée en puissance accélérée des modèles chinois depuis la publication de DeepSeek-R1 début 2025, qui avait démontré qu'un modèle très compétitif pouvait être entraîné à coût réduit. La demande domestique en Chine croît également fortement, ce qui renforce la capacité des acteurs locaux à investir en R&D et à baisser leurs prix à l'export, une dynamique que Washington surveille de près dans un contexte de restrictions sur les semi-conducteurs.

UELes développeurs européens indépendants sont directement exposés à cette concurrence tarifaire, les modèles chinois comme DeepSeek ou Qwen s'imposant comme alternatives compétitives aux outils américains sur des plateformes comme OpenRouter.

BusinessOpinion
1 source
Qu’est-ce que TBPN, le podcast (et l’équipe de com) racheté par OpenAI ?
4La Tribune 

Qu’est-ce que TBPN, le podcast (et l’équipe de com) racheté par OpenAI ?

OpenAI a racheté TBPN, un podcast populaire auprès des entrepreneurs de la tech, dont les animateurs Jordi Hays et John Coogan rejoignent l'entreprise en tant qu'employés à temps plein. Les deux hommes, qui se revendiquent ouvertement "tech bros", prenaient en charge la communication informelle et l'image de marque de la startup depuis leur show, très suivi dans les cercles de la Silicon Valley. Cette acquisition s'inscrit dans une stratégie de reconquête narrative pour OpenAI, dont l'image a été sérieusement écornée ces derniers mois. Le mouvement QuitGPT, qui encourage les utilisateurs à abandonner les produits de la société pour des raisons éthiques, a mis en lumière une défiance croissante envers l'entreprise. En intégrant des personnalités médiatiques influentes plutôt que des communicants traditionnels, OpenAI parie sur une voix plus authentique et proche de sa communauté cible. TBPN s'était imposé comme une référence pour les fondateurs de startups et les investisseurs en capital-risque, un public stratégique pour OpenAI qui cherche à maintenir son leadership face à une concurrence accrue. Hays et Coogan apportent avec eux un réseau et une crédibilité dans l'écosystème entrepreneurial que peu de directeurs de communication classiques pourraient offrir — une approche que d'autres géants tech pourraient être tentés de reproduire.

BusinessOpinion
1 source