Aller au contenu principal
Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?
BusinessLe Big Data2sem

Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?

Résumé IASource uniqueImpact UE
Source originale ↗·

Dans certaines entreprises, la facture mensuelle liée à l'intelligence artificielle dépasse désormais celle des salaires humains. C'est le constat documenté par Axios dans une enquête publiée fin avril 2026, qui révèle que le coût du traitement des requêtes IA excède, dans certains cas, celui des équipes en chair et en os. Bryan Catanzaro, responsable chez Nvidia, a confirmé le phénomène pour ses propres équipes. Le New York Times rapporte que certains utilisateurs intensifs atteignent plus de 150 000 dollars de dépenses mensuelles en tokens, certains ingénieurs dépensant davantage en usage d'IA qu'ils ne touchent en salaire. Chez Uber, des équipes utilisant des outils comme Claude Code ont déjà épuisé leur budget annuel d'IA bien avant la fin de l'exercice, selon The Information. Le phénomène a même un nom dans les milieux tech : le "tokenmaxxing", pratique où les ingénieurs maximisent délibérément leur consommation de tokens, parfois comme indicateur implicite de performance.

Ce glissement remet en cause la promesse fondatrice de l'IA en entreprise : réduire les coûts grâce à l'automatisation. L'équation est plus complexe que prévu. Chaque requête envoyée à un modèle consomme des tokens facturés, et lorsque les agents s'exécutent en parallèle sans supervision directe, les volumes explosent. La structure de coût des entreprises se transforme en profondeur : les dépenses, autrefois fixes et prévisibles via les ressources humaines, deviennent variables, dépendantes de l'usage, et donc difficiles à piloter. Pour les organisations qui n'ont pas mis en place de garde-fous, la dérive peut être rapide. Chez Meta, l'utilisation de l'IA est désormais intégrée dans l'évaluation des performances des employés, ce qui pousse mécaniquement à une consommation accrue. Google et Microsoft adoptent des dynamiques similaires, une grande part du code produit étant déjà générée par des modèles.

Cette situation profite directement aux fournisseurs de modèles. OpenAI et Anthropic bénéficient de la hausse de consommation, Anthropic ayant d'ailleurs relevé ses tarifs récemment. Les investisseurs parient sur la capacité des modèles les plus efficaces à capter davantage de clients en offrant un meilleur ratio performance-coût. Du côté des entreprises consommatrices, les réponses restent expérimentales. Jensen Huang, PDG de Nvidia, a évoqué l'idée de distribuer des quotas de tokens aux employés, à l'image d'une enveloppe salariale dédiée à l'IA, ce qui transformerait l'accès à la puissance de calcul en véritable avantage compétitif individuel. Le compute est en passe de devenir une ligne budgétaire stratégique aussi sensible que la masse salariale, obligeant les directions financières à repenser leur manière de gouverner ces outils avant que la facture ne devienne incontrôlable.

Impact France/UE

Les entreprises européennes adoptant des agents IA à grande échelle sont exposées aux mêmes dérives budgétaires documentées aux États-Unis, sans cadre de gouvernance des coûts IA encore établi au niveau sectoriel ou réglementaire.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées
1The Decoder 

GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées

OpenAI a doublé le prix affiché de GPT-5.5 par rapport à GPT-5.4, justifiant cette hausse par la promesse que des réponses plus courtes compenseraient le surcoût pour les utilisateurs. Mais une analyse conduite par OpenRouter, plateforme d'agrégation de modèles de langage, révèle que la réalité est bien différente : en s'appuyant sur des données d'utilisation réelles, OpenRouter conclut que les coûts effectifs ont augmenté de 49 à 92 % selon la longueur des requêtes soumises au modèle. Cette hausse tarifaire a des conséquences directes pour les développeurs et les entreprises qui intègrent GPT-5.5 dans leurs applications via l'API d'OpenAI. Une augmentation pouvant frôler les 100 % sur certains usages représente un choc budgétaire significatif, en particulier pour les startups et les équipes traitant de gros volumes de requêtes. Le fait que l'écart entre le tarif officiel et le coût réel soit si prononcé soulève également des questions sur la transparence des grilles tarifaires publiées par OpenAI. Anthropic a, elle aussi, relevé le prix de son modèle haut de gamme Opus 4.7, confirmant une tendance de fond dans l'industrie. Les deux entreprises se préparent à une introduction en bourse, ce qui pourrait expliquer une stratégie visant à améliorer leur rentabilité à court terme. Alors que la concurrence entre les grands acteurs de l'IA reste intense, cette course à la hausse des prix suggère que la phase de conquête à prix coûtant laisse progressivement place à une logique de monétisation plus agressive.

UELes startups et développeurs européens intégrant GPT-5.5 ou Opus 4.7 via API subissent une hausse effective de 49 à 92 % de leurs coûts opérationnels, les contraignant à revoir leurs budgets ou à évaluer des alternatives open-source.

💬 La "promesse de réponses plus courtes qui compensent", c'était du flan. OpenRouter a sorti les vraies données d'utilisation : +49 à +92% sur les coûts réels selon la longueur des requêtes, loin de ce qu'annonce le tarif officiel. Entre les deux boîtes en pré-IPO qui remontent leurs marges simultanément, le signal est assez lisible.

BusinessOpinion
1 source
OpenAI révèle pourquoi il a vraiment tué Sora (ce n’est pas ce que vous croyez)
2Le Big Data 

OpenAI révèle pourquoi il a vraiment tué Sora (ce n’est pas ce que vous croyez)

OpenAI a annoncé le 24 mars 2026 la fermeture de Sora, son réseau social entièrement propulsé par l'intelligence artificielle, moins d'un an après son lancement. L'application avait pourtant connu un démarrage fulgurant : près d'un million de téléchargements et une place parmi les plus populaires de l'App Store aux États-Unis. Lancée en parallèle du modèle vidéo Sora 2, la plateforme offrait une expérience sociale complète — génération de vidéos par IA, publication, partage, likes, commentaires et remixage des créations d'autres utilisateurs. Son interface, inspirée de TikTok et Instagram, enchaînait des vidéos réalistes mais jamais totalement convaincantes, provoquant ce malaise bien connu théorisé par Masahiro Mori sous le nom de « vallée de l'étrange ». Malgré des performances comparables à celles de Gemini et son modèle Veo 3, les vidéos trahissaient parfois leur origine artificielle : incohérences visuelles, mouvements erratiques, artefacts sonores. La fermeture s'explique par une équation économique intenable. Selon TechCrunch, faire tourner Sora coûtait environ un million de dollars par jour, pour des revenus mensuels estimés à seulement 367 000 dollars. Contrairement à ChatGPT, massivement adopté dans les entreprises, Sora restait cantonné au divertissement — un segment nettement moins rentable. Mais au-delà des finances, le projet s'est heurté à un problème de désinformation structurel. OpenAI avait intégré un filigrane pour signaler les vidéos générées par IA, mais des utilisateurs ont rapidement trouvé des moyens de le supprimer. Une fois effacé, il devenait quasi impossible de distinguer une vraie vidéo d'une création artificielle. Le potentiel de manipulation — déjà amplifié par la nature virale du réseau social — rendait la plateforme particulièrement exposée aux abus à grande échelle. La trajectoire de Sora illustre les tensions profondes auxquelles se confrontent les grandes entreprises d'IA en tentant de combiner génération de contenu synthétique et dynamiques de réseau social. Le modèle économique des plateformes sociales repose sur le volume et la publicité, deux logiques difficilement compatibles avec le coût astronomique de l'inférence vidéo. OpenAI, qui cherche à rentabiliser ses investissements colossaux avant une introduction en Bourse attendue, ne pouvait se permettre de subventionner indéfiniment un service déficitaire. L'arrêt de Sora ne signifie pas l'abandon du modèle vidéo — l'API restera accessible — mais marque la fin d'une tentative risquée de transformer une capacité technique spectaculaire en produit grand public viable. D'autres acteurs, Google et Meta en tête, observeront attentivement cet échec avant de s'aventurer sur le même terrain.

BusinessOpinion
1 source
C’est confirmé : OpenAI met toute sa puissance sur une IA qui va changer le monde
3Le Big Data 

C’est confirmé : OpenAI met toute sa puissance sur une IA qui va changer le monde

OpenAI a décidé de mettre en pause, voire d'abandonner définitivement, le développement de Sora, son générateur de vidéos par IA, pour réorienter l'intégralité de ses ressources de calcul vers une nouvelle génération de modèles d'intelligence artificielle. L'annonce a été confirmée officiellement dans la documentation interne d'OpenAI début avril 2026. Sam Altman, PDG de l'entreprise, a déclaré publiquement : "Il se passe quelque chose de très important. Je ne m'attendais pas, il y a trois ou six mois, à être là où nous en sommes aujourd'hui." Ce pivot stratégique rappelle directement celui opéré lors du tournant vers GPT-3, quand OpenAI avait déjà sacrifié plusieurs projets prometteurs en robotique pour concentrer ses moyens sur un pari jugé plus structurant. Cette fois, l'enjeu est encore plus ambitieux : il s'agit de développer des agents autonomes capables d'exécuter des tâches complexes, de prendre des décisions et de s'intégrer dans des flux de travail à grande échelle. La décision révèle une réalité fondamentale du secteur : les ressources de calcul sont un goulot d'étranglement absolu. Poursuivre Sora en parallèle aurait mobilisé une part trop importante de cette infrastructure au détriment des projets jugés prioritaires. Pour les entreprises, les conséquences pourraient être considérables : Altman évoque l'émergence d'un écosystème entier de "chercheurs et entreprises spécialisées dans l'automatisation", construits autour de ces nouveaux agents. Ces systèmes ne se contenteraient plus d'assister les utilisateurs, mais automatiseraient des processus entiers, de la recherche à l'exécution opérationnelle. La frustration exprimée par certains développeurs sur les forums communautaires d'OpenAI illustre bien que Sora suscitait des attentes réelles, mais la logique de concentration l'a emporté sur celle de la diversification. Ce virage s'inscrit dans une dynamique plus large de course aux ressources qui structure désormais toute l'industrie de l'IA. Comme le résume Altman lui-même : "Tout repose sur le calcul." Les modèles les plus performants exigent des infrastructures massives, des centres de données spécialisés et des investissements colossaux, ce qui crée une guerre des ressources entre les grands acteurs. OpenAI, face à Microsoft, Google DeepMind et Anthropic, fait le choix de concentrer ses efforts plutôt que de les disperser, quitte à abandonner des projets pourtant aboutis. Les avancées internes des derniers mois ont visiblement été si rapides que même l'équipe dirigeante ne les anticipait pas, suggérant un saut qualitatif potentiellement significatif. Si les prochains modèles tiennent leurs promesses, on pourrait assister à un changement de paradigme dans la manière dont individus et organisations interagissent avec l'IA, non plus comme un outil d'assistance, mais comme un acteur autonome dans la chaîne de décision.

UELa réorientation vers les agents autonomes va intensifier la pression sur les entreprises européennes pour adapter leurs workflows et relance le débat sur la souveraineté numérique face à la concentration des ressources de calcul chez les géants américains.

BusinessOpinion
1 source
Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?
4Le Big Data 

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

En l'espace de quelques jours fin avril 2026, trois startups chinoises d'intelligence artificielle ont concentré à elles seules plus de 11 milliards de dollars de financements potentiels ou confirmés. DeepSeek, fondée en 2023 avec le soutien du fonds quantitatif HighFlyer, s'apprête à réaliser sa toute première levée de fonds externe : le tour de table, initialement envisagé à 300 millions de dollars pour une valorisation de 10 milliards, pourrait atteindre 7 milliards de dollars et valoriser l'entreprise à près de 50 milliards. Moonshot AI, créateur des modèles Kimi, a de son côté levé 2 milliards de dollars sous la conduite de Meituan, portant ses financements cumulés à 3,9 milliards en six mois et sa valorisation au-delà de 20 milliards. StepFun, basée à Shanghai, serait quant à elle proche de finaliser une levée de 2,5 milliards de dollars, selon des sources proches du dossier. Ces chiffres signalent un tournant dans la perception des acteurs chinois de l'IA par les investisseurs mondiaux. Pendant des années, le capital-risque technologique en Chine a stagné depuis 2021, les investisseurs doutant de la capacité des startups locales à transformer leurs modèles en revenus durables. Ce doute s'estompe : les entreprises chinoises ont démontré qu'elles pouvaient non seulement produire des modèles de classe mondiale, mais aussi les intégrer dans des usages concrets et monétisables. Moonshot, par son partenariat avec Meituan, déploie des agents capables de réserver des hôtels ou commander des repas, tandis que son modèle Kimi K2.6 peut orchestrer jusqu'à 300 sous-agents simultanément pour automatiser des tâches complexes en programmation. StepFun déploie déjà ses modèles sur des millions d'appareils, des smartphones aux véhicules intelligents, visant une IA embarquée à grande échelle plutôt qu'un simple chatbot. Ce regain de dynamisme s'inscrit dans un contexte de compétition mondiale accélérée avec les laboratoires américains comme OpenAI, Google DeepMind ou Anthropic. DeepSeek avait marqué les esprits début 2025 en publiant en open source ses modèles R1 puis V4, prouvant qu'un acteur chinois pouvait rivaliser techniquement avec des budgets bien inférieurs. Cette stratégie ouverte a construit une crédibilité internationale que les investisseurs valorisent aujourd'hui massivement. La question qui se pose désormais est celle de l'expansion hors de Chine : ces entreprises ne cherchent plus seulement à rattraper la Silicon Valley, elles visent à imposer leurs plateformes, leurs infrastructures et leurs standards dans les marchés asiatiques, européens et émergents, là où les acteurs américains n'ont pas encore consolidé leur position.

UELes startups chinoises de l'IA ciblent explicitement les marchés européens pour leur expansion, ce qui pourrait modifier l'équilibre concurrentiel et offrir aux acteurs européens des alternatives aux plateformes américaines.

💬 11 milliards en quelques jours, c'est plus le signal d'un rattrapage, c'est celui d'une offensive. Ce qui a changé par rapport à 2023, c'est que Moonshot ou StepFun ne vendent plus des benchmarks : ils déploient des agents qui réservent des hôtels et font tourner de l'IA embarquée sur des millions d'appareils. Et l'Europe, là-dedans, c'est exactement le terrain que ces boîtes visent, là où ni Google ni OpenAI n'ont vraiment verrouillé quoi que ce soit.

BusinessOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour