Aller au contenu principal
5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer
InfrastructureVentureBeat AI6sem· 2 min de lecture

5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer

Source originale ↗·

Les entreprises ont dépensé des milliards pour sécuriser des GPU à tout prix, et la facture est désormais présentée. Selon Gartner, l'infrastructure IA représente 401 milliards de dollars de nouvelles dépenses en 2025, mais des audits terrain révèlent une réalité bien plus sombre : le taux d'utilisation moyen des GPU en entreprise stagne à 5 %. Pendant deux ans, la panique du « GPU scramble » a poussé DSI et directions financières à constituer des réserves de capacité sous des cycles d'amortissement de trois à cinq ans. Ces actifs sont désormais des coûts fixes inscrits aux bilans, indépendamment de leur usage effectif. Les chiffres du Q1 2026 confirment le basculement : dans le baromètre de VentureBeat, le critère « accès aux GPU » est passé de 20,8 % à 15,4 % en un seul trimestre comme moteur principal des décisions d'achat, tandis que le coût par inférence et le TCO (coût total de possession) bondissaient de 34 % à 41 %, dépassant la performance pure comme critère dominant.

À 5 % d'utilisation, l'arithmétique est brutale : pour chaque dollar investi en silicium, 95 centimes partent directement dans la marge des fournisseurs cloud. Dans n'importe quel autre département, un taux de gaspillage de 95 % serait un motif de licenciement ; dans l'infrastructure IA, on appelait ça de la « préparation ». Les grands groupes comme Intuit, Mastercard ou Pfizer, qui bénéficiaient de relations privilégiées avec AWS, Azure et GCP pour sécuriser des réservations de capacité, se sont retrouvés riches en GPU mais pauvres en production : des équipes internes paralysées par la gouvernance des données, la gravité des données et une immaturité architecturale persistante ont empêché toute valorisation réelle de ces ressources. Le discours dominant sur la rareté du silicium a servi d'écran commode pour masquer cette inefficacité structurelle.

Ce virage marque la fin de l'ère du chèque en blanc. Le passage à une tarification à l'usage en 2026 transforme les architectures héritées des phases pilotes, pensées avec des tokens en coûts fixes, en véritables passifs financiers. Les agents en contexte long et les pipelines de récupération complexes, construits quand les tokens étaient un coût noyé dans des licences forfaitaires, deviennent intenables sous une facturation mesuréé. L'inférence n'est plus un projet tactique : c'est un modèle économique stratégique dont les unités économiques sont, pour la plupart des entreprises, encore insoutenables. La question n'est plus de savoir si les investissements passés étaient justifiés, mais comment extraire un retour mesurable d'une infrastructure déjà déployée avant que les cycles d'amortissement ne l'emportent.

Impact France/UE

Les entreprises européennes investies en infrastructure GPU sont exposées au même risque de sous-utilisation à 5 %, avec des cycles d'amortissement sur 3-5 ans qui transforment ces actifs en passifs financiers au moment où le marché bascule vers une tarification à l'usage.

💬 L'analyse de Mathieu

5 % d'utilisation, c'est le genre de stat qui ferait renvoyer n'importe quel responsable infra dans un département classique. La panique du GPU scramble a servi de couverture : on achetait du silicium pour ne pas rater le train, sans se demander si les équipes data étaient capables d'en faire quelque chose. Le basculement vers le pay-as-you-go va transformer ces réserves en passifs, et ça va faire des dégâts.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

La mise en production de l'IA à grande échelle oblige les entreprises à repenser leur infrastructure
1VentureBeat AI 

La mise en production de l'IA à grande échelle oblige les entreprises à repenser leur infrastructure

Le déploiement de l'intelligence artificielle à grande échelle est en train de redessiner l'architecture informatique des entreprises. C'est le constat que dressent Tarkan Maner, président et directeur commercial de Nutanix, et Thomas Cornely, vice-président exécutif en charge du produit, qui observent une bascule profonde dans la façon dont les organisations abordent l'IA. Après des mois de prototypes et d'expérimentations dans le cloud, les entreprises cherchent désormais à déployer ces systèmes sur des charges de travail réelles, pour des milliers d'utilisateurs simultanés. Cornely résume l'écart : "Faire un prototype, c'est une chose. Déployer ce prototype pour 10 000 employés, c'en est une autre." La montée en puissance des agents IA, capables d'enchaîner des tâches complexes en toute autonomie, amplifie encore cette pression : les infrastructures doivent gérer des workflows multi-étapes, des charges imprévisibles en temps réel, et coordonner l'accès aux données entre équipes. Ce passage du pilote à la production révèle des contraintes pratiques que l'expérimentation en cloud avait masquées. Les questions de gouvernance des données, de contrôle, de sécurité et de coût prennent rapidement le dessus dès que les volumes augmentent. Les cas d'usage qui progressent le plus vite sont la recherche documentaire et la récupération de connaissances, la détection prédictive des menaces en cybersécurité, les workflows de développement logiciel, et le support client. Dans le secteur bancaire, notamment en Europe et aux États-Unis, des établissements déploient déjà des outils de reconnaissance faciale et de détection prédictive des cyberattaques pilotés par l'IA. L'enjeu n'est pas de remplacer les décisions humaines, mais de trouver le bon équilibre entre l'automatisation et l'intervention humaine, ce que Maner résume par l'idée d'une "harmonie" entre agents IA, robotique et capital humain, optimisée pour de meilleurs résultats opérationnels. Cette transformation s'inscrit dans un contexte de mutation accélérée qui touche l'ensemble des secteurs, des industries réglementées comme la banque, la santé et les administrations publiques jusqu'à la distribution et la manufacture. Des frameworks comme OpenClaw facilitent désormais la création d'agents par des équipes qui n'ont pas de compétences en infrastructure IA, ce qui accroît la pression sur les plateformes chargées de sécuriser ces déploiements. La trajectoire dominante est claire : débuter dans le cloud pour accéder rapidement aux ressources, puis rapatrier les applications critiques sur site à mesure qu'elles entrent en production, sur des plateformes qui résolvent les problèmes de sécurité et de coût à la fois. Nutanix se positionne explicitement sur ce segment, voyant dans cette transition une opportunité de croissance majeure à mesure que les entreprises cherchent des partenaires capables d'accompagner l'IA de l'expérimentation au déploiement industriel.

UELe secteur bancaire européen est cité parmi les premiers adopteurs de l'IA en production (reconnaissance faciale, détection prédictive des cyberattaques), illustrant les enjeux croissants de gouvernance et de souveraineté des données pour les entreprises françaises et européennes.

InfrastructureActu
1 source
☕️ SoftBank investirait jusqu’à 100 milliards de dollars dans des infrastructures IA en France
2Next INpact 

☕️ SoftBank investirait jusqu’à 100 milliards de dollars dans des infrastructures IA en France

SoftBank serait sur le point d'annoncer un investissement pouvant atteindre 100 milliards de dollars pour déployer des centres de données dédiés à l'intelligence artificielle en France. Selon Bloomberg, le projet a germé lors d'une rencontre entre Masayoshi Son, PDG du conglomérat japonais, et Emmanuel Macron, qui s'était rendu au Japon fin mars 2026 pour une tournée de séduction auprès des grandes puissances économiques de l'archipel. Le président français aurait directement proposé à Son d'installer des infrastructures IA en France, une démarche inhabituelle pour l'investisseur, plus souvent approché par des dirigeants d'entreprise que par des chefs d'État. L'annonce officielle pourrait intervenir lors du sommet Choose France, prévu le 19 mai. Le montant réel reste incertain et pourrait s'avérer bien inférieur aux 100 milliards évoqués en interne. Si l'investissement se concrétise même partiellement, il constituerait un signal fort pour le positionnement de la France comme hub européen de l'IA. Paris mise sur un argument concurrentiel clé : l'énergie nucléaire, qui permet d'alimenter les centres de données avec "l'électricité la plus décarbonée d'Europe", selon les termes de Macron lui-même. Dans un contexte où les besoins énergétiques des datacenters explosent, cet avantage structurel pourrait peser lourd face à des alternatives moins stables ou plus carbonées. Pour les acteurs tech cherchant à construire des infrastructures à grande échelle en Europe, la France deviendrait une option sérieuse. Cet éventuel engagement s'inscrit dans une dynamique d'investissements massifs dans l'IA mondiale. SoftBank est déjà engagé à hauteur de plus de 60 milliards de dollars dans OpenAI, dont il détient 13 % du capital, et co-finance l'initiative Stargate aux États-Unis aux côtés d'OpenAI, Oracle et du fonds émirati MGX, pour un total annoncé de 500 milliards. En parallèle, Microsoft, Meta, Amazon et Alphabet ont promis plus de 700 milliards de dépenses combinées pour la seule année 2026. Masayoshi Son est réputé pour ses annonces spectaculaires dont la concrétisation s'étale sur des années, voire n'aboutit jamais. Du côté français, Macron avait déjà annoncé en février 2025, lors du Sommet pour l'action sur l'IA à Paris, 109 milliards d'euros d'investissements sur plusieurs années, présentés comme l'équivalent français de Stargate. L'éventuelle entrée de SoftBank viendrait compléter cet édifice, mais les détails du projet restent flous et la portée de l'annonce finale pourrait encore évoluer significativement d'ici le 19 mai.

UESi l'investissement se concrétise même partiellement, la France se positionnerait comme le principal hub européen de l'IA, attirant des dizaines de milliards de dollars en centres de données et consolidant son avantage compétitif grâce à son électricité nucléaire décarbonée.

💬 100 milliards, c'est le chiffre qu'on sort pour les journalistes, mais avec Masa Son, t'as appris à diviser par 3 avant de célébrer. Ce qui tient vraiment debout dans ce dossier, c'est l'argument nucléaire : la France a une carte différenciante face à ses voisins européens, et là c'est pas du flan. Reste à voir ce que donnera le 19 mai.

InfrastructureOpinion
1 source
L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars
3VentureBeat AI 

L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars

Cerebras Systems, le fabricant de puces basé dans la Silicon Valley, a fait une entrée fracassante au Nasdaq le 14 mai 2026 : l'action a ouvert à 350 dollars, soit presque le double du prix d'introduction fixé à 185 dollars, propulsant la capitalisation boursière de la société au-delà des 100 milliards de dollars dès les premières heures de cotation. L'entreprise a levé 5,55 milliards de dollars en vendant 30 millions d'actions, ce qui en fait la plus grande introduction en bourse technologique américaine depuis Uber en 2019. La demande des investisseurs a littéralement submergé les attentes initiales : Cerebras avait d'abord fixé une fourchette cible de 115 à 125 dollars, l'avait relevée à 150-160 dollars face à l'engouement, avant de fixer le prix final encore au-dessus de cette bande révisée. La société, dont le chiffre d'affaires a progressé de 76 % pour atteindre 510 millions de dollars en 2025, a annoncé son intention d'investir ces nouveaux capitaux dans l'expansion de son infrastructure cloud d'inférence. Ce succès boursier repose sur une architecture radicalement différente de celle de Nvidia. Le Wafer-Scale Engine WSE-3 de Cerebras est un processeur unique qui occupe un wafer de silicium entier, le disque de la taille d'une assiette à partir duquel sont normalement découpées des dizaines de puces classiques. Avec 4 000 milliards de transistors, 900 000 cœurs de calcul et 44 gigaoctets de mémoire embarquée, il est 58 fois plus grand que le B200 de Nvidia et offre 2 625 fois plus de bande passante mémoire. Cet avantage est décisif pour l'inférence d'IA, le processus qui consiste à faire tourner un modèle entraîné pour générer des réponses : chaque token produit nécessite de déplacer l'intégralité des poids du modèle entre mémoire et calcul, une opération strictement séquentielle où la bande passante est le facteur limitant. Cerebras revendique des vitesses d'inférence jusqu'à 15 fois supérieures aux solutions GPU concurrentes sur modèles open source, un chiffre confirmé par le cabinet d'analyse indépendant Artificial Analysis. Le parcours de Cerebras jusqu'à cette cotation a été tout sauf linéaire. Fondée en 2015 sur le pari que les charges de travail de l'IA seraient fondamentalement contraintes par les communications entre mémoire et calcul, la société a passé des années à résoudre un problème que l'industrie des semi-conducteurs avait tenté et abandonné à plusieurs reprises sur 75 ans d'histoire. Cerebras avait une première fois déposé son dossier d'introduction en bourse en septembre 2024, avant de se retirer face aux questions des régulateurs sur sa dépendance quasi totale à un seul client aux Émirats arabes unis. Le redépôt d'avril 2026 présentait un profil radicalement différent : des partenariats avec OpenAI et Amazon Web Services, un service d'inférence cloud en forte croissance, et une base de revenus diversifiée. La capitalisation atteinte dès le premier jour place désormais Cerebras parmi les fabricants de semi-conducteurs les plus valorisés au monde, dans un secteur où Nvidia règne encore en maître incontesté.

💬 100 milliards le premier jour, le marché n'attendait visiblement que ça. Ce qui m'intéresse plus que le chiffre boursier, c'est que leur pari de 2015 (l'inférence est bornée par la bande passante mémoire, pas par le compute) était juste, là où l'industrie avait abandonné ce problème depuis 75 ans. Les 15x sur l'inférence sont validés par des labos indépendants, c'est pas du marketing.

InfrastructureActu
1 source
SiMa.ai lève des fonds à une valorisation de 1,4 milliard de dollars
4The Information AI 

SiMa.ai lève des fonds à une valorisation de 1,4 milliard de dollars

La startup californienne SiMa.ai, basée à San Jose, est en négociations avancées pour lever plus de 100 millions de dollars auprès d'investisseurs, à une valorisation d'environ 1,4 milliard de dollars. Cette opération représenterait une hausse de plus de 45 % par rapport à sa valorisation de 960 millions de dollars enregistrée en août 2025, selon les données de PitchBook. L'information a été confirmée par deux sources proches du dossier. SiMa.ai conçoit des puces d'inférence destinées à fonctionner directement sur des appareils embarqués comme des drones, des robots ou des caméras de surveillance, sans avoir recours à la puissance de calcul des centres de données. Cette levée de fonds illustre une conviction croissante chez certains investisseurs : l'avenir de l'IA ne se jouera pas uniquement dans les datacenters. Les puces de SiMa.ai sont optimisées pour la sobriété énergétique et l'exécution locale des modèles, ce que l'on appelle l'inférence en périphérie de réseau ("edge inference"). Pour les industriels du secteur manufacturier, de la logistique ou de la sécurité, cette approche ouvre la possibilité de déployer de l'intelligence artificielle sur le terrain, en temps réel, sans dépendre d'une connexion permanente au cloud ni des coûts associés. Si ce modèle se généralise, il pourrait remettre en question les projections actuelles sur les besoins en infrastructure numérique mondiale. SiMa.ai s'inscrit dans une vague de startups spécialisées qui cherchent à conquérir des segments du marché des puces IA laissés en dehors du champ de Nvidia, dont la domination porte essentiellement sur les GPU de datacenter. Ces challengers misent sur des cas d'usage précis et des contraintes physiques réelles, comme la consommation électrique ou la taille des appareils. Le marché de l'IA embarquée, porté par l'essor des véhicules autonomes, de la robotique industrielle et des systèmes de vision par ordinateur, devrait croître fortement dans les prochaines années, attirant capitaux et compétition dans ce segment encore dominé par aucun acteur incontournable.

UEL'essor de l'inférence embarquée pourrait à terme bénéficier aux industriels européens (manufacturier, logistique, robotique) en réduisant leur dépendance au cloud américain.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic