InfrastructureNVIDIA AI Blog1h· 2 min de lecture

NVIDIA ouvre son informatique IA à grande échelle et invite ses partenaires à soutenir le développement de l'infrastructure IA

NVIDIA a dévoilé un nouveau modèle économique destiné à ouvrir l'accès à ses infrastructures de calcul aux startups d'IA, créateurs de modèles, entreprises et organismes de recherche qui manquaient jusqu'ici de capital pour financer des équipements aussi coûteux. Ce dispositif repose sur un partage de revenus avec des "AI clouds" partenaires : ces fournisseurs de cloud vendront des services alimentés par la technologie NVIDIA, l'entreprise percevant à la fois le revenu classique lié à la vente de matériel et une part des revenus générés par la capacité mise à disposition. Deux entreprises figurent parmi les premières à s'engager dans ce cadre. Sharon AI va déployer jusqu'à 40 000 GPU NVIDIA Grace Blackwell GB300, dans ce que son cofondateur et PDG James Manning décrit comme une étape clé de la mission de l'entreprise pour offrir une infrastructure de calcul IA souveraine et à grande échelle. Firmus, de son côté, construit un site "DSX AI factory" à Batam, en Indonésie, dont la puissance devrait atteindre 360 mégawatts pour jusqu'à 170 000 GPU NVIDIA. Selon Tim Rosenfield, co-PDG de Firmus Technologies, les entreprises spécialisées en IA ont besoin d'un accès à une infrastructure de calcul évolutive, économe en énergie et en coûts, pour rester compétitives à l'échelle mondiale.

Cette initiative répond à un changement structurel de la demande en calcul : l'IA passe désormais du stade de l'entraînement de modèles à celui de la production à grande échelle, avec des "usines à IA" qui doivent tourner en continu pour générer des tokens en volume. Or les jeunes pousses du secteur peinaient à obtenir des financements pour ce type d'infrastructure, même lorsqu'elles disposaient d'engagements clients à long terme, faute de garanties suffisantes pour les prêteurs. En alignant ses intérêts économiques sur ceux des clouds partenaires, NVIDIA espère accélérer l'adoption de ses plateformes par le segment le plus dynamique du marché, tout en s'assurant un flux de revenus récurrent indexé sur l'usage réel. Pour les créateurs de modèles, fournisseurs d'inférence et plateformes d'agents, cela signifie un accès plus rapide à du calcul accéléré de bout en bout, sans avoir à attendre les longues étapes de sélection de site, d'approvisionnement énergétique, de construction et de mise en service du matériel.

Des acteurs déjà bien installés dans l'écosystème, comme Baseten, Fireworks AI et Together AI, illustrent où se dirige la demande : ils ont besoin d'un accès immédiat à de la capacité cloud pour l'entraînement, le post-entraînement, l'ajustement fin et l'inférence agentique à fort volume, au service de développeurs et d'entreprises qui déploient l'IA en production. Leurs clients recherchent un accès fiable à du calcul NVIDIA à mesure que leur usage grandit, tout en gardant une flexibilité commerciale pour passer du stade pilote à la production. Ce nouveau modèle s'inscrit dans la stratégie plus large de NVIDIA de structurer un réseau mondial de partenaires cloud et d'usines à IA, conçu pour soutenir la montée en puissance rapide de l'intelligence artificielle générative et agentique dans les prochaines années.

Dans nos dossiers

NVIDIA Agents IA Blackwell Souveraineté IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

La mise en production de l'IA à grande échelle oblige les entreprises à repenser leur infrastructure

Le déploiement de l'intelligence artificielle à grande échelle est en train de redessiner l'architecture informatique des entreprises. C'est le constat que dressent Tarkan Maner, président et directeur commercial de Nutanix, et Thomas Cornely, vice-président exécutif en charge du produit, qui observent une bascule profonde dans la façon dont les organisations abordent l'IA. Après des mois de prototypes et d'expérimentations dans le cloud, les entreprises cherchent désormais à déployer ces systèmes sur des charges de travail réelles, pour des milliers d'utilisateurs simultanés. Cornely résume l'écart : "Faire un prototype, c'est une chose. Déployer ce prototype pour 10 000 employés, c'en est une autre." La montée en puissance des agents IA, capables d'enchaîner des tâches complexes en toute autonomie, amplifie encore cette pression : les infrastructures doivent gérer des workflows multi-étapes, des charges imprévisibles en temps réel, et coordonner l'accès aux données entre équipes. Ce passage du pilote à la production révèle des contraintes pratiques que l'expérimentation en cloud avait masquées. Les questions de gouvernance des données, de contrôle, de sécurité et de coût prennent rapidement le dessus dès que les volumes augmentent. Les cas d'usage qui progressent le plus vite sont la recherche documentaire et la récupération de connaissances, la détection prédictive des menaces en cybersécurité, les workflows de développement logiciel, et le support client. Dans le secteur bancaire, notamment en Europe et aux États-Unis, des établissements déploient déjà des outils de reconnaissance faciale et de détection prédictive des cyberattaques pilotés par l'IA. L'enjeu n'est pas de remplacer les décisions humaines, mais de trouver le bon équilibre entre l'automatisation et l'intervention humaine, ce que Maner résume par l'idée d'une "harmonie" entre agents IA, robotique et capital humain, optimisée pour de meilleurs résultats opérationnels. Cette transformation s'inscrit dans un contexte de mutation accélérée qui touche l'ensemble des secteurs, des industries réglementées comme la banque, la santé et les administrations publiques jusqu'à la distribution et la manufacture. Des frameworks comme OpenClaw facilitent désormais la création d'agents par des équipes qui n'ont pas de compétences en infrastructure IA, ce qui accroît la pression sur les plateformes chargées de sécuriser ces déploiements. La trajectoire dominante est claire : débuter dans le cloud pour accéder rapidement aux ressources, puis rapatrier les applications critiques sur site à mesure qu'elles entrent en production, sur des plateformes qui résolvent les problèmes de sécurité et de coût à la fois. Nutanix se positionne explicitement sur ce segment, voyant dans cette transition une opportunité de croissance majeure à mesure que les entreprises cherchent des partenaires capables d'accompagner l'IA de l'expérimentation au déploiement industriel.

UELe secteur bancaire européen est cité parmi les premiers adopteurs de l'IA en production (reconnaissance faciale, détection prédictive des cyberattaques), illustrant les enjeux croissants de gouvernance et de souveraineté des données pour les entreprises françaises et européennes.

InfrastructureActu

1 source

2NVIDIA AI Blog

NVIDIA et AWS s'associent pour déployer l'IA en production à grande échelle

NVIDIA et Amazon Web Services (AWS) ont annoncé un approfondissement de leur collaboration pour faciliter le déploiement de l'intelligence artificielle à grande échelle en production. Les nouvelles instances Amazon EC2 G7, équipées des GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, offrent jusqu'à 4,6 fois les performances d'inférence IA et 2,1 fois les performances graphiques par rapport aux instances G6 précédentes. Ces instances supportent jusqu'à huit GPU, 256 Go de mémoire GPU totale, 700 Gbps de réseau EFA et jusqu'à 7,6 To de stockage NVMe local, dans des configurations allant d'un à huit GPU. Parallèlement, la bibliothèque NVIDIA cuVS devient le moteur par défaut de l'indexation vectorielle dans Amazon OpenSearch Serverless, avec des performances jusqu'à dix fois supérieures à un coût quatre fois inférieur aux solutions CPU seules. AWS a par ailleurs obtenu le statut NVIDIA Exemplar Cloud sur les GPU GB300, certification attestant que la plateforme répond aux seuils de performance de référence de NVIDIA pour les charges d'entraînement. Ces avancées changent concrètement la donne pour les équipes qui construisent des systèmes d'IA en production. L'intégration de cuVS comme choix par défaut dans OpenSearch Serverless transforme la recherche vectorielle accélérée par GPU d'un projet d'optimisation spécialisé en une capacité AWS standard. Cela signifie que des bases de données vectorielles à l'échelle du milliard d'entrées deviennent réalisables en moins d'une heure, ce qui rend les applications de type RAG (retrieval-augmented generation), recherche sémantique ou IA agentique accessibles à un bien plus grand nombre d'entreprises. Pour les équipes médias et data, les instances G7 permettent également de traiter des workflows vidéo haute résolution, du rendu 3D et des pipelines analytiques sur le même type d'instance, réduisant la complexité opérationnelle. Cette collaboration s'inscrit dans une course entre les grands fournisseurs cloud à offrir la meilleure infrastructure IA clé en main. NVIDIA cherche à s'imposer comme couche matérielle incontournable, aussi bien pour l'entraînement que pour l'inférence et la recherche vectorielle, tandis qu'AWS veut simplifier le passage de l'expérimentation à la production. Le statut Exemplar Cloud sur les GB300, fruit d'un co-engineering approfondi entre les deux entreprises, positionne AWS comme plateforme de référence pour les charges d'entraînement les plus exigeantes. Les instances G7 seront prochainement disponibles sur Amazon SageMaker AI, ce qui étendra encore leur portée. L'enjeu sous-jacent est de réduire la friction entre infrastructure et application pour les entreprises qui n'ont pas les ressources pour gérer leurs propres clusters GPU.

UELes entreprises européennes utilisant AWS pourront bénéficier de performances IA nettement améliorées pour l'inférence et la recherche vectorielle, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.

InfrastructureOpinion

1 source

3NVIDIA AI Blog

NVIDIA et ses partenaires transforment la publicité et le marketing avec l'IA à Cannes Lions

Au festival Cannes Lions, qui se tient du 22 au 26 juin en France, plusieurs entreprises partenaires de NVIDIA présentent leurs solutions d'intelligence artificielle pour transformer la publicité et le marketing à grande échelle. Parmi elles : Alembic, Amazon Web Services (AWS), Criteo, Higgsfield, KERV.ai et Taboola. Alembic, spécialisée dans l'IA causale, sera la première entreprise du secteur à utiliser les systèmes NVIDIA DGX Vera Rubin SuperPODs pour modéliser les véritables moteurs de croissance marketing, non plus de simples corrélations, mais des relations de causalité réelles entre canaux, marchés et audiences. Criteo, qui gère l'un des plus grands réseaux de recommandation publicitaire au monde, a quant à elle atteint une accélération d'environ deux fois plus rapide dans l'entraînement de ses modèles grâce aux GPU NVIDIA Blackwell et à la bibliothèque open source cuEmbed, libérant ainsi près de 17 000 heures de GPU par an. AWS propose de son côté une pile d'infrastructure clé en main pour les acteurs de l'adtech, permettant de faire tourner des modèles d'IA directement dans les fenêtres d'enchères en temps réel via NVIDIA Triton Inference Server. Taboola utilise ces mêmes GPU pour alimenter DeeperDive, son moteur de réponses conversationnelles. Ces annonces illustrent un basculement profond dans l'industrie publicitaire : là où le numérique avait apporté la vitesse, l'IA apporte désormais l'autonomie opérationnelle. Pour les régies et plateformes publicitaires, l'enjeu n'est plus de savoir si elles adopteront l'IA, mais si leur infrastructure pourra suivre le rythme. La capacité à enchérir, recommander et optimiser en quelques millisecondes sur des milliards de transactions quotidiennes nécessite une puissance de calcul que seuls les GPU spécialisés peuvent fournir aujourd'hui. Pour Criteo, gagner 17 000 heures GPU par an, c'est concrètement réduire les coûts de calcul tout en améliorant la pertinence des recommandations produit pour des centaines de millions d'acheteurs. Pour les annonceurs utilisant AWS, passer de règles manuelles à des modèles d'IA pour l'optimisation des prix d'enchère représente un avantage concurrentiel direct sur les marchés programmatiques. Cette convergence entre NVIDIA et l'écosystème publicitaire s'inscrit dans une dynamique plus large d'industrialisation de l'IA à l'échelle des entreprises. NVIDIA, dont les GPU dominent le marché de l'entraînement des modèles d'IA, cherche désormais à s'imposer aussi dans l'inférence à la milliseconde, le moment où l'IA doit prendre une décision en production. Cannes Lions, rendez-vous annuel de l'industrie créative et publicitaire mondiale, devient ainsi une vitrine technologique où les fournisseurs d'infrastructure rivalisent pour convaincre les grandes marques et agences que l'IA agentique, des systèmes capables de planifier, exécuter et optimiser des campagnes de manière autonome, est désormais prête pour le déploiement en entreprise.

UECriteo, acteur français majeur de l'adtech, économise 17 000 heures GPU par an grâce aux puces NVIDIA Blackwell, renforçant directement sa compétitivité sur les marchés programmatiques européens.

💬 Le festival le plus glamour de la pub qui se transforme en vitrine GPU, ça dit quelque chose sur où en est vraiment l'IA. Ce qui change ici, c'est le pivot de NVIDIA vers l'inférence temps réel : dominer l'entraînement c'était bien, mais dominer la décision à la milliseconde dans les enchères programmatiques, c'est là où se jouent les vraies marges. Criteo qui gagne 17 000 heures GPU par an sur ses modèles, c'est pas du marketing.

InfrastructureActu

1 source

4Le Big Data

Micron et Anthropic s’allient pour renforcer l’infrastructure IA de nouvelle génération

Micron Technology et Anthropic ont annoncé le 22 juin 2026 un accord stratégique multidimensionnel qui couvre quatre axes : la co-conception d'architectures de mémoire et de stockage optimisées pour l'IA, un contrat d'approvisionnement à long terme portant sur l'ensemble du portefeuille de solutions pour centres de données de Micron, le déploiement interne de Claude dans les équipes de Micron, et une participation financière du fabricant de semi-conducteurs au tour de financement Série H d'Anthropic. Les deux entreprises travailleront conjointement sur les technologies de mémoire HBM (High Bandwidth Memory), les modules DRAM haute performance et les SSD destinés aux data centers, ces composants étant au cœur des infrastructures utilisées pour entraîner et faire tourner les modèles Claude. Tom Brown, cofondateur d'Anthropic et responsable des ressources de calcul, a souligné que la mémoire et le stockage jouent désormais un rôle central dans l'efficacité des systèmes d'entraînement et d'inférence de l'entreprise. L'accord illustre un changement de paradigme dans l'industrie de l'IA : les performances d'un modèle dépendent autant de l'infrastructure matérielle sous-jacente que des avancées algorithmiques. Si les GPU concentrent souvent l'attention, la capacité à les alimenter en données à très haute vitesse est devenue un facteur déterminant pour les coûts, les performances et la consommation énergétique des infrastructures à grande échelle. En optimisant directement les sous-systèmes mémoire utilisés par Anthropic, les deux partenaires cherchent à réduire le coût unitaire de chaque requête traitée par Claude, un levier concurrentiel décisif à mesure que le marché de l'IA générative se masse-marketise. L'accord d'approvisionnement sécurise par ailleurs la croissance d'Anthropic sur plusieurs années, limitant les risques de pénurie de composants critiques dans un marché en tension. Ce partenariat s'inscrit dans une stratégie plus large d'Anthropic visant à consolider ses fondations matérielles face à l'accélération de la demande autour de Claude. Reuters relevait récemment qu'Anthropic a multiplié les accords destinés à renforcer ses capacités de calcul, au moment même où le laboratoire enchaîne les levées de fonds record pour rivaliser avec OpenAI et Google DeepMind. Pour Micron, l'opération représente une opportunité de positionner ses technologies HBM comme composants de référence dans les futures générations d'infrastructure IA, un marché en croissance explosive. La collaboration technique directe avec un laboratoire de premier plan lui permet d'anticiper les besoins des prochains modèles et d'adapter son offre bien en amont, transformant un client potentiel en co-développeur.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic