
xAI montre les difficultés d'exploiter de nombreux GPU en parallèle
xAI, la société d'intelligence artificielle d'Elon Musk, dispose d'environ 500 000 GPU Nvidia, l'une des plus grandes collections de puces serveur parmi les développeurs d'IA ayant rendu leurs données publiques. Pourtant, selon un mémo interne révélé par Business Insider, le taux de Model Flops Utilization (MFU) de xAI n'atteignait que 11 % ces dernières semaines, soit la proportion de puissance de calcul réellement exploitée sur l'ensemble des chips disponibles. Un score de 100 % représenterait une utilisation totale et théoriquement parfaite de l'infrastructure.
Ce chiffre est particulièrement frappant dans un secteur où les GPU Nvidia sont devenus une ressource rare et âprement disputée. Les développeurs d'IA se battent pour en obtenir, et subissent une pression intense pour en tirer le maximum. Un chercheur d'une entreprise concurrente interrogé sur le sujet a reconnu que dépasser 40 % d'utilisation restait difficile pour la plupart des acteurs du secteur, mais a qualifié le taux de 11 % d'« incroyablement bas ». Ce qui rend la situation encore plus surprenante, c'est que xAI est réputée pour configurer ses clusters GPU selon les recommandations officielles de Nvidia.
La racine du problème tient à la nature même de l'entraînement des modèles d'IA : une activité dite « en rafales », marquée par des pics soudains d'utilisation suivis de périodes creuses, le temps que les chercheurs analysent les résultats et décident de la prochaine étape. Ce schéma rend l'optimisation du taux d'utilisation structurellement difficile, contrairement à l'inférence, phase où les modèles sont déployés pour les utilisateurs finaux, qui génère une charge plus régulière et prévisible. La course aux GPU bat son plein dans toute l'industrie, mais l'écart entre les ressources accumulées et leur efficacité réelle soulève des questions sur la rentabilité de ces investissements massifs, à l'heure où les valorisations de l'IA reposent en partie sur la capacité à exploiter cette infrastructure.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




