InfrastructureIEEE Spectrum AI5j

Les locataires de GPU jouent à la loterie du silicium

Résumé IASource uniqueImpact UE

Des chercheurs du College of William & Mary, du Jefferson Lab et de la société Silicon Data ont publié une étude révélant une variabilité surprenante dans les performances des GPU loués sur le cloud, un phénomène connu sous le nom de "silicon lottery". Pour mesurer l'ampleur du problème, ils ont exécuté 6 800 instances de leur benchmark maison, SiliconMark, sur 3 500 GPU sélectionnés aléatoirement chez 11 fournisseurs de cloud. Les puces testées couvrent 11 modèles Nvidia, du plus courant au plus avancé, le H200 SXM. Les résultats sont frappants : les performances en calcul virgule flottante 16 bits des 259 GPU H100 PCIe varient jusqu'à 34,5 %, tandis que la bande passante mémoire des 253 H200 SXM présente des écarts allant jusqu'à 38 %. Carmen Li, fondatrice et PDG de Silicon Data, résume l'enjeu : une puce plus chère et plus récente peut, dans certains cas, délivrer moins de performances qu'un modèle plus ancien.

Ces écarts ont des conséquences financières directes pour les entreprises et les équipes de recherche qui louent du temps de calcul GPU pour entraîner ou faire tourner des modèles de langage. Si un client paie un tarif premium pour accéder à un H100 ou un H200, il n'a aucune garantie que l'instance qu'il reçoit correspond aux spécifications annoncées. À grande échelle, une différence de performance de 30 à 40 % représente des heures de calcul supplémentaires, des coûts gonflés et des délais allongés. La pratique actuelle de louer des GPU comme une ressource homogène et interchangeable ne reflète pas la réalité physique des puces, et les fournisseurs cloud n'offrent généralement aucune transparence sur la qualité individuelle des instances proposées.

Le phénomène de la "silicon lottery" était déjà documenté depuis au moins 2022, quand des chercheurs de l'Université du Wisconsin avaient constaté son impact sur les superordinateurs dépendant de GPU. Mais son ampleur dans le cloud computing grand public n'avait jamais été mesurée à cette échelle. Les causes sont multiples : variation dans les procédés de fabrication des puces, différences de configuration côté opérateurs, systèmes de refroidissement hétérogènes et historique d'utilisation des GPU. L'analyse de Silicon Data pointe toutefois les défauts de fabrication comme principal responsable. Pour se protéger, Jason Cornick, responsable infrastructure chez Silicon Data, recommande une approche pragmatique : benchmarker systématiquement chaque instance louée avec un outil comme SiliconMark avant de lancer des charges de travail intensives, afin de vérifier que les performances réelles correspondent bien à ce qui est facturé.

Impact France/UE

Les équipes de recherche et entreprises IA en France et en Europe qui louent des GPU sur le cloud subissent potentiellement des écarts de performance de 30 à 40 % à tarif égal, alourdissant directement leurs coûts de calcul et leurs délais d'entraînement de modèles.

Dans nos dossiers

NVIDIA

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1NVIDIA AI Blog

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

NVIDIA et ses partenaires industriels investissent Hannover Messe 2026, le salon phare de l'industrie manufacturière qui se tient du 20 au 24 avril à Hanovre, en Allemagne, pour y présenter ce qu'ils considèrent comme la prochaine révolution de la production : l'usine pilotée par l'intelligence artificielle. Au programme, des démonstrations concrètes couvrant l'informatique accélérée, la simulation physique en temps réel, les agents autonomes et les robots humanoïdes opérant en environnement industriel. Parmi les temps forts, l'annonce de l'Industrial AI Cloud, l'un des plus grands centres d'IA d'Europe, construit en Allemagne par Deutsche Telekom sur infrastructure NVIDIA. Des géants comme SAP, Siemens, ABB, Dassault Systèmes, Cadence ou encore Synopsys y participent, aux côtés d'acteurs spécialisés comme Agile Robots, Wandelbots et PhysicsX. EDAG, prestataire indépendant d'ingénierie, a par ailleurs annoncé le déploiement de sa plateforme de métavers industriel "metys" sur ce cloud souverain, ciblant l'automobile et l'ingénierie lourde. L'enjeu est considérable : l'industrie manufacturière mondiale fait face à une pression simultanée sur les cycles de conception, les coûts opérationnels et la disponibilité de main-d'œuvre qualifiée. L'IA n'est plus une option expérimentale mais un levier de compétitivité immédiat. Les jumeaux numériques à l'échelle d'une usine entière, construits sur les bibliothèques Omniverse de NVIDIA et le standard ouvert OpenUSD, permettent désormais de simuler, tester et optimiser des lignes de production en continu, sans interruption physique. ABB, par exemple, intègre ces outils dans sa suite Genix pour analyser la performance des équipements et accélérer la recherche de causes de pannes via des agents IA. Pour les ingénieurs, la simulation physique en temps réel change radicalement le processus de conception : là où des heures de calcul étaient nécessaires, des résultats apparaissent en secondes. Cette offensive de NVIDIA dans l'industrie s'inscrit dans une stratégie plus large visant à faire de l'informatique accélérée le socle de la transformation industrielle européenne. Le concept de "souveraineté numérique" est central : face aux craintes européennes de dépendance aux clouds américains, l'Industrial AI Cloud positionné en Allemagne répond à une demande politique autant qu'économique. CUDA-X, Omniverse, les modèles ouverts Nemotron et les puces NVIDIA équipent désormais les logiciels des éditeurs les plus influents du secteur, de Siemens à Dassault Systèmes, créant un écosystème interdépendant difficile à contourner. Dell, IBM, Lenovo et PNY complètent l'offre avec des systèmes accélérés déployables de la périphérie jusqu'aux datacenters. La prochaine étape, déjà visible à Hanovre, est l'intégration de robots humanoïdes dans les chaînes de production, un marché où NVIDIA entend jouer un rôle d'infrastructure aussi structurant que dans l'IA générative.

UEL'Industrial AI Cloud inauguré en Allemagne par Deutsche Telekom sur infrastructure NVIDIA, avec la participation de Dassault Systèmes et Siemens, offre aux industriels européens une infrastructure cloud souveraine pour déployer l'IA en production.

InfrastructureActu

1 source

2Latent Space

Les prix des H100 s'envolent

Depuis décembre 2025, les prix de location des GPU H100 de Nvidia repartent fortement à la hausse, effaçant la correction observée début 2025 après le choc DeepSeek R1. Selon le commentateur Dylan sur le podcast Dwarkesh, les H100 valent aujourd'hui davantage qu'il y a trois ans, au moment de leur lancement. Cette inversion de tendance intervient alors que la plupart des acteurs du secteur tablaient sur une dépréciation progressive sur quatre à sept ans. Les raisons avancées sont multiples : une pénurie générale de puces haut de gamme, l'émergence des modèles de raisonnement de décembre 2025, et l'amélioration spectaculaire des logiciels d'inférence, qui rendent une puce de quatre ans beaucoup plus efficace qu'elle ne l'était à sa sortie. Ce retournement a des implications directes sur la rentabilité des centres de données spécialisés en IA. Les modèles économiques construits sur l'hypothèse d'une dépréciation rapide du matériel se trouvent bousculés : un H100 loué plus cher que prévu change profondément les équations de coût par token pour les opérateurs cloud et les startups qui ne possèdent pas leur propre infrastructure. En parallèle, Anthropic serait sur le point de bénéficier d'un financement de Google pour la construction d'un centre de données — selon le Financial Times — ce qui illustre que la compétition frontier est désormais autant une question de capacité électrique et de capital que d'algorithmes. Ce contexte tendu se double d'une semaine chargée pour Anthropic : une fuite interne sur un système baptisé « Claude Mythos » a révélé l'existence d'un nouveau niveau d'abonnement nommé Capybara, décrit comme supérieur à Claude Opus 4.6, plus grand et plus intelligent, avec des scores nettement améliorés en programmation, raisonnement académique et cybersécurité. Le déploiement serait freiné par des contraintes de coût et de sécurité, et la spéculation va bon train autour d'un modèle de classe 10 000 milliards de paramètres évoqué par le PDG Dario Amodei. Pendant ce temps, côté open source, Zhipu a ouvert l'accès à GLM-5.1 à tous les utilisateurs de son offre coding, et la communauté constate que l'écart entre modèles fermés et ouverts n'a jamais été aussi réduit. Des utilisateurs rapportent avoir remplacé des abonnements TTS payants par des modèles locaux comme Qwen 3.5 14B, ou avoir fait tourner Qwen3.5-35B dans 24 Go de VRAM avec seulement 1 % de perte de performance grâce à la quantification — signe que l'économie de l'inférence locale devient viable pour un nombre croissant de cas d'usage professionnels.

UELa hausse des prix des H100 alourdit les coûts d'exploitation des opérateurs cloud et startups européens sans infrastructure propre, fragilisant les modèles économiques construits sur une dépréciation rapide du matériel.

InfrastructureActu

1 source

3Ars Technica AI

Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières

Onze campus de centres de données en cours de construction aux États-Unis sont associés à des projets de centrales au gaz naturel dont les émissions combinées pourraient dépasser 129 millions de tonnes de gaz à effet de serre par an, soit plus que l'ensemble des émissions du Maroc en 2024. Ces chiffres proviennent de documents de demandes de permis atmosphériques examinés par WIRED, soumis auprès d'agences étatiques américaines. Les infrastructures concernées alimenteront des centres de données au service de quelques-unes des entreprises d'IA les plus puissantes du pays : OpenAI, Meta, Microsoft et xAI figurent parmi les bénéficiaires identifiés. Ces projets sont soit déjà annoncés, soit en cours de construction. Ce que révèlent ces chiffres dépasse largement un problème local : ils illustrent le coût climatique concret de la course mondiale à l'IA. La particularité de ces installations est qu'elles contournent le réseau électrique public pour alimenter directement et exclusivement les centres de données, un modèle dit "behind-the-meter". Résultat : leurs émissions échappent aux mécanismes habituels de régulation et de comptabilisation carbone. Pour les consommateurs, la dynamique est aussi préoccupante : cette stratégie est partiellement motivée par la volonté des géants technologiques d'éviter d'alourdir les factures d'électricité des ménages, qui subissent déjà une résistance publique croissante face à la hausse des tarifs. Cette tendance s'inscrit dans un contexte de saturation du réseau électrique américain : les délais de raccordement aux opérateurs traditionnels s'allongent considérablement, poussant les développeurs de centres de données à produire leur propre énergie. Les projets listés ne représentent selon WIRED que la partie émergée de l'iceberg, alors que les grandes entreprises technologiques s'engagent dans des centaines de nouveaux centres à travers le pays. La question de la compatibilité entre les objectifs climatiques des États-Unis et l'expansion effrénée de l'infrastructure IA se pose désormais avec une acuité nouvelle, au moment où plusieurs États commencent à examiner plus attentivement les permis accordés à ces projets énergétiques hors réseau.

UEL'UE, engagée dans des objectifs climatiques contraignants et le reporting carbone obligatoire, pourrait faire face à des pressions similaires si le modèle d'alimentation directe hors réseau se généralise dans ses propres projets d'infrastructure IA.

InfrastructureActu

1 source

4Frandroid

L’alliance inattendue : quand les batteries géantes débloquent la surpuissance de l’intelligence artificielle

Les grandes installations de stockage par batteries, jusqu'ici connues pour acheter de l'électricité lors des creux tarifaires et la revendre aux heures de pointe, s'ouvrent à une nouvelle activité : alimenter directement les centres de données consacrés à l'intelligence artificielle. Ce modèle, encore émergent, consiste à brancher des batteries industrielles en amont des datacenters pour lisser leur consommation électrique, réduire les pics de demande sur le réseau et garantir une alimentation stable même lorsque l'approvisionnement classique vacille. L'enjeu est considérable pour l'industrie de l'IA, dont les besoins énergétiques explosent. Les grands modèles d'entraînement et d'inférence mobilisent des milliers de GPU en continu, générant des appels de puissance brutaux difficiles à absorber pour les gestionnaires de réseau. En s'intercalant entre le réseau électrique et les serveurs, les batteries permettent aux opérateurs de datacenters de sécuriser leur alimentation, d'éviter des pénalités de dépassement de puissance souscrite et, surtout, de s'implanter dans des zones où la capacité réseau est insuffisante pour ouvrir un datacenter classique. Cette convergence survient alors que les géants du cloud et les startups d'IA se livrent une course mondiale aux infrastructures de calcul, tandis que les réseaux électriques peinent à suivre le rythme. Des développeurs de projets de stockage, notamment aux États-Unis et au Royaume-Uni, explorent déjà des contrats directs avec des opérateurs comme Microsoft, Google ou des acteurs spécialisés en IA. La question reste celle de la rentabilité : combiner arbitrage tarifaire et fourniture de puissance garantie à un datacenter pourrait transformer le modèle économique du stockage stationnaire, longtemps dépendant des seules subventions et des marchés de capacité.

UEL'Europe, confrontée aux mêmes tensions sur ses réseaux électriques face à l'explosion des besoins en datacenters IA, pourrait adopter ce modèle hybride batteries-datacenter pour contourner ses propres contraintes de capacité réseau.

InfrastructureOpinion

1 source