NVIDIA et AWS s'associent pour déployer l'IA en production à grande échelle
NVIDIA et Amazon Web Services (AWS) ont annoncé un approfondissement de leur collaboration pour faciliter le déploiement de l'intelligence artificielle à grande échelle en production. Les nouvelles instances Amazon EC2 G7, équipées des GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, offrent jusqu'à 4,6 fois les performances d'inférence IA et 2,1 fois les performances graphiques par rapport aux instances G6 précédentes. Ces instances supportent jusqu'à huit GPU, 256 Go de mémoire GPU totale, 700 Gbps de réseau EFA et jusqu'à 7,6 To de stockage NVMe local, dans des configurations allant d'un à huit GPU. Parallèlement, la bibliothèque NVIDIA cuVS devient le moteur par défaut de l'indexation vectorielle dans Amazon OpenSearch Serverless, avec des performances jusqu'à dix fois supérieures à un coût quatre fois inférieur aux solutions CPU seules. AWS a par ailleurs obtenu le statut NVIDIA Exemplar Cloud sur les GPU GB300, certification attestant que la plateforme répond aux seuils de performance de référence de NVIDIA pour les charges d'entraînement.
Ces avancées changent concrètement la donne pour les équipes qui construisent des systèmes d'IA en production. L'intégration de cuVS comme choix par défaut dans OpenSearch Serverless transforme la recherche vectorielle accélérée par GPU d'un projet d'optimisation spécialisé en une capacité AWS standard. Cela signifie que des bases de données vectorielles à l'échelle du milliard d'entrées deviennent réalisables en moins d'une heure, ce qui rend les applications de type RAG (retrieval-augmented generation), recherche sémantique ou IA agentique accessibles à un bien plus grand nombre d'entreprises. Pour les équipes médias et data, les instances G7 permettent également de traiter des workflows vidéo haute résolution, du rendu 3D et des pipelines analytiques sur le même type d'instance, réduisant la complexité opérationnelle.
Cette collaboration s'inscrit dans une course entre les grands fournisseurs cloud à offrir la meilleure infrastructure IA clé en main. NVIDIA cherche à s'imposer comme couche matérielle incontournable, aussi bien pour l'entraînement que pour l'inférence et la recherche vectorielle, tandis qu'AWS veut simplifier le passage de l'expérimentation à la production. Le statut Exemplar Cloud sur les GB300, fruit d'un co-engineering approfondi entre les deux entreprises, positionne AWS comme plateforme de référence pour les charges d'entraînement les plus exigeantes. Les instances G7 seront prochainement disponibles sur Amazon SageMaker AI, ce qui étendra encore leur portée. L'enjeu sous-jacent est de réduire la friction entre infrastructure et application pour les entreprises qui n'ont pas les ressources pour gérer leurs propres clusters GPU.
Les entreprises européennes utilisant AWS pourront bénéficier de performances IA nettement améliorées pour l'inférence et la recherche vectorielle, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




