NVIDIA ouvre son informatique IA à grande échelle et invite ses partenaires à soutenir le développement de l'infrastructure IA
NVIDIA a dévoilé un nouveau modèle économique destiné à ouvrir l'accès à ses infrastructures de calcul aux startups d'IA, créateurs de modèles, entreprises et organismes de recherche qui manquaient jusqu'ici de capital pour financer des équipements aussi coûteux. Ce dispositif repose sur un partage de revenus avec des "AI clouds" partenaires : ces fournisseurs de cloud vendront des services alimentés par la technologie NVIDIA, l'entreprise percevant à la fois le revenu classique lié à la vente de matériel et une part des revenus générés par la capacité mise à disposition. Deux entreprises figurent parmi les premières à s'engager dans ce cadre. Sharon AI va déployer jusqu'à 40 000 GPU NVIDIA Grace Blackwell GB300, dans ce que son cofondateur et PDG James Manning décrit comme une étape clé de la mission de l'entreprise pour offrir une infrastructure de calcul IA souveraine et à grande échelle. Firmus, de son côté, construit un site "DSX AI factory" à Batam, en Indonésie, dont la puissance devrait atteindre 360 mégawatts pour jusqu'à 170 000 GPU NVIDIA. Selon Tim Rosenfield, co-PDG de Firmus Technologies, les entreprises spécialisées en IA ont besoin d'un accès à une infrastructure de calcul évolutive, économe en énergie et en coûts, pour rester compétitives à l'échelle mondiale.
Cette initiative répond à un changement structurel de la demande en calcul : l'IA passe désormais du stade de l'entraînement de modèles à celui de la production à grande échelle, avec des "usines à IA" qui doivent tourner en continu pour générer des tokens en volume. Or les jeunes pousses du secteur peinaient à obtenir des financements pour ce type d'infrastructure, même lorsqu'elles disposaient d'engagements clients à long terme, faute de garanties suffisantes pour les prêteurs. En alignant ses intérêts économiques sur ceux des clouds partenaires, NVIDIA espère accélérer l'adoption de ses plateformes par le segment le plus dynamique du marché, tout en s'assurant un flux de revenus récurrent indexé sur l'usage réel. Pour les créateurs de modèles, fournisseurs d'inférence et plateformes d'agents, cela signifie un accès plus rapide à du calcul accéléré de bout en bout, sans avoir à attendre les longues étapes de sélection de site, d'approvisionnement énergétique, de construction et de mise en service du matériel.
Des acteurs déjà bien installés dans l'écosystème, comme Baseten, Fireworks AI et Together AI, illustrent où se dirige la demande : ils ont besoin d'un accès immédiat à de la capacité cloud pour l'entraînement, le post-entraînement, l'ajustement fin et l'inférence agentique à fort volume, au service de développeurs et d'entreprises qui déploient l'IA en production. Leurs clients recherchent un accès fiable à du calcul NVIDIA à mesure que leur usage grandit, tout en gardant une flexibilité commerciale pour passer du stade pilote à la production. Ce nouveau modèle s'inscrit dans la stratégie plus large de NVIDIA de structurer un réseau mondial de partenaires cloud et d'usines à IA, conçu pour soutenir la montée en puissance rapide de l'intelligence artificielle générative et agentique dans les prochaines années.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




