Aller au contenu principal
#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA
InfrastructureNext INpact5h· 1 min de lecture

#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA

Source originale ↗·

Malgré l'essor de puces spécialisées développées par les géants du cloud, les GPU NVIDIA continuent de dominer massivement le marché de l'intelligence artificielle, tant pour l'entraînement des modèles que pour l'inférence. Google dispose de ses TPU (Tensor Processing Units), Amazon de ses puces Trainium, Microsoft de ses Maia -- pourtant, les datacenters du monde entier continuent de s'approvisionner en H100 et B200 de Santa Clara. La réponse tient en quatre lettres : CUDA. Lancée en 2007, soit près de deux décennies avant l'explosion de l'IA générative, la plateforme Compute Unified Device Architecture de NVIDIA s'est imposée comme un standard de facto que personne n'a réussi à détrôner depuis.

L'avantage décisif de NVIDIA n'est pas seulement matériel -- c'est avant tout logiciel. Les ASIC comme les TPU sont des circuits intégrés à application spécifique, donc plus efficaces et souvent moins énergivores pour des tâches ciblées. Mais CUDA représente vingt ans d'optimisations, de bibliothèques, de frameworks, et d'une communauté de développeurs formés sur cet écosystème. PyTorch, TensorFlow, les outils de recherche des grands laboratoires -- tout est pensé et optimisé pour CUDA. Migrer vers une alternative signifie réécrire des piles logicielles entières, former des ingénieurs, et accepter une perte de performance pendant la transition. Pour la plupart des équipes, le coût dépasse largement les économies énergétiques promises.

Ce verrouillage technologique illustre un phénomène classique dans l'industrie du logiciel : celui des effets de réseau et des coûts de migration qui figent un standard même lorsque des alternatives supérieures existent. Les hyperscalers comme Google ou Amazon utilisent bien leurs puces propriétaires en interne pour certaines charges de travail -- mais ils continuent également d'acheter massivement du NVIDIA pour leurs clients, qui exigent la compatibilité CUDA. L'extension récente de NVIDIA vers l'informatique quantique, qui "fait peur à tout le monde" selon les observateurs du secteur, montre que l'entreprise entend reproduire ce même playbook : imposer une plateforme logicielle tôt, avant que le marché ne se structure, et verrouiller l'écosystème pour les décennies suivantes.

Impact France/UE

Les entreprises et laboratoires européens restent dépendants de l'écosystème CUDA-NVIDIA, ce qui limite leur capacité à développer une souveraineté technologique en matière d'infrastructure IA.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Nvidia mise sur l’IA physique : pourquoi les marchés d’Asie s’emballent déjà ?
1Le Big Data 

Nvidia mise sur l’IA physique : pourquoi les marchés d’Asie s’emballent déjà ?

L'Asie représente désormais 90 % des coûts de production de Nvidia, contre 65 % il y a tout juste un an. Ce basculement, documenté par Bloomberg, illustre une réorientation stratégique majeure du géant américain des puces graphiques. Nvidia ne se concentre plus uniquement sur les processeurs pour data centers : sous l'impulsion de son PDG Jensen Huang, l'entreprise accélère dans ce qu'elle appelle l'IA physique, un ensemble de technologies englobant la robotique, les systèmes autonomes et la production industrielle augmentée. Dans ce cadre, des partenariats se nouent à grande vitesse avec des acteurs asiatiques majeurs comme SK Hynix et Samsung Electronics pour la mémoire et les composants avancés, mais aussi avec des entreprises moins connues à l'international : LG Electronics sur un projet de robot domestique, Nanya Technology à Taïwan, et des fabricants chinois comme Huizhou Desay et Pateo Connect. Les marchés boursiers ont immédiatement réagi : LG Electronics a bondi jusqu'à 15 % après l'annonce de discussions avec Nvidia, Nanya Technology a progressé de 10 %, tandis que les titres chinois concernés enregistraient également des hausses marquées. L'impact de cette dynamique dépasse largement les seuls partenaires directs de Nvidia. Chaque annonce de collaboration est désormais perçue par les investisseurs comme un signal de croissance future, transformant des entreprises industrielles régionales en acteurs stratégiques mondiaux du jour au lendemain. Pour Ling Vey-Sern, analyste chez Union Bancaire Privée, cette dépendance croissante à l'égard des chaînes d'approvisionnement asiatiques est structurelle et inévitable : les géants technologiques n'ont d'autre choix que de s'appuyer sur des écosystèmes de fabrication très spécialisés. L'IA physique, contrairement à l'IA générative qui reposait essentiellement sur des infrastructures cloud pilotées par Microsoft, Amazon ou Alphabet, exige une base industrielle dense : capteurs, actionneurs, systèmes embarqués, assemblage de précision. C'est précisément là où l'Asie concentre ses compétences depuis des décennies. Ce virage s'inscrit dans un contexte d'investissements colossaux de la part des géants américains, certains annonçant jusqu'à 200 milliards de dollars de dépenses en infrastructures IA. Nvidia capte une part significative de ces budgets et entraîne dans son sillage l'ensemble de sa chaîne de fournisseurs. Samsung en a déjà tiré les bénéfices, ayant récemment multiplié ses résultats trimestriels. La part asiatique dans les coûts de production de Nvidia n'est pas une simple métrique de dépendance : c'est le reflet d'un cycle d'investissement qui se déplace vers le prochain goulot d'étranglement, après le calcul et la mémoire, désormais vers les composants et systèmes nécessaires à l'IA qui agit dans le monde réel. Les prochaines étapes dépendront de la vitesse à laquelle les robots, véhicules autonomes et usines intelligentes passeront du stade expérimental au déploiement industriel à grande échelle.

UELe basculement des chaînes d'approvisionnement vers l'Asie pour l'IA physique accentue la dépendance technologique de l'Europe vis-à-vis de fournisseurs non-européens, renforçant les enjeux de souveraineté industrielle déjà au cœur des débats sur l'autonomie stratégique de l'UE.

InfrastructureOpinion
1 source
L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
2NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
3NVIDIA AI Blog 

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Les centres de données d'entreprise sont en train de vivre une mutation profonde : autrefois dédiés au stockage et au traitement de données, ils deviennent des usines à tokens, dont la production principale est l'intelligence artificielle générée à la demande. Cette transformation oblige les entreprises à repenser entièrement leur manière d'évaluer le coût total de possession (TCO) de leur infrastructure IA. Or, selon NVIDIA, la majorité des décideurs continuent de se focaliser sur des métriques obsolètes : le coût par GPU par heure ou les FLOPS par dollar, c'est-à-dire la puissance brute de calcul obtenue pour chaque dollar investi. Ces indicateurs mesurent des intrants, alors que les entreprises, elles, font tourner leur activité sur des extrants. La seule métrique qui compte réellement est le coût par million de tokens produits, soit le coût tout compris pour générer chaque unité d'intelligence délivrée à l'utilisateur final. Optimiser ce coût par token change fondamentalement l'équation économique de l'IA. Le numérateur de cette équation, le coût horaire du GPU, est visible et facile à comparer entre fournisseurs cloud ou solutions on-premise. Mais c'est le dénominateur, soit le volume de tokens effectivement délivrés par seconde, qui détermine la rentabilité réelle. Augmenter ce débit produit deux effets simultanés : il réduit le coût unitaire de chaque interaction servie, améliorant ainsi les marges, et il augmente le nombre de tokens par mégawatt consommé, ce qui permet de générer davantage de revenus à partir du même investissement infrastructurel. NVIDIA affirme proposer le coût par token le plus bas du secteur, notamment sur les modèles de raisonnement de type mixture-of-experts (MoE), qui représentent aujourd'hui la catégorie de modèles la plus largement déployée en production. Cette réévaluation des critères de choix s'inscrit dans un contexte de montée en puissance de l'IA agentique, où les systèmes autonomes enchaînent des séquences longues d'inférences, rendant le débit et la latence encore plus critiques. Des technologies comme le décodage spéculatif, la prédiction multi-token, le routage KV-aware ou encore le déchargement du cache KV permettent d'augmenter substantiellement le débit réel sans changer le matériel. La prise en charge de la précision FP4, la capacité de l'interconnexion à gérer le trafic all-to-all des modèles MoE, ou encore les optimisations de la couche de serving deviennent des critères de sélection déterminants. Pour les déploiements on-premise notamment, où l'engagement en capital sur le foncier, l'énergie et l'infrastructure est massif, maximiser l'intelligence produite par mégawatt n'est plus une option technique mais un impératif économique.

InfrastructureActu
1 source
NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
4NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic