Aller au contenu principal
NVIDIA DSX Air accélère le temps de génération des tokens grâce à la simulation pour les usines d'IA
OutilsNVIDIA AI Blog14sem· 2 min de lecture

NVIDIA DSX Air accélère le temps de génération des tokens grâce à la simulation pour les usines d'IA

Source originale ↗·

NVIDIA franchit une nouvelle étape dans le déploiement des usines d'IA avec le lancement de DSX Air, une plateforme SaaS de simulation logique présentée par le PDG Jensen Huang lors du GTC 2026 à San Jose. Cette solution permet de construire un jumeau numérique complet d'une infrastructure d'IA — calcul, réseau, stockage, orchestration et sécurité — avant même que le premier serveur ne soit déballé, réduisant le temps de mise en production de plusieurs semaines ou mois à quelques jours, voire quelques heures.

L'enjeu est considérable pour l'industrie : chaque semaine perdue dans l'intégration et le débogage d'une infrastructure hyperscale représente des coûts opérationnels massifs et un retard compétitif direct. En déplaçant ces étapes critiques dans l'environnement de simulation, DSX Air transforme la façon dont les opérateurs conçoivent et valident leurs environnements, sans mobiliser de matériel physique coûteux. La promesse : accélérer la révolution industrielle de l'IA à une échelle et une vitesse inédites.

DSX Air s'intègre dans la plateforme NVIDIA DSX, le blueprint officiel pour les usines d'IA. La solution reproduit en haute fidélité les GPU, SuperNIC, DPU et switchs NVIDIA, et s'interconnecte via des API ouvertes avec des partenaires couvrant le stockage, le routage, la sécurité et l'orchestration. Des acteurs majeurs comme CoreWeave utilisent déjà la plateforme pour simuler et valider leurs environnements avant réception du matériel. Au GTC, NVIDIA a démontré un environnement multi-tenant RTX PRO Server entièrement simulé, intégrant Netris pour l'orchestration réseau, Rafay pour l'orchestration hôte et NVIDIA Run:ai pour l'allocation des GPU. Une démonstration sur le stand illustrait également une charge de travail de RAG vidéo tournant sur le système d'exploitation VAST AI, avec des nœuds DataEngine traitant et indexant du contenu vidéo de bout en bout.

Les fabricants de serveurs et les éditeurs de logiciels d'orchestration sont parmi les premiers bénéficiaires : ils peuvent désormais modéliser des architectures de référence, tester leurs stacks logiciels et livrer des configurations sur mesure à leurs clients entreprises sans construire de laboratoires physiques onéreux. Cette capacité à valider des déploiements complexes dans un environnement réaliste avant toute installation physique pourrait redéfinir les standards du secteur pour les clouds de tier 2 et les grandes entreprises qui cherchent à déployer des services d'IA clé en main.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Nvidia dévoile un système de puces basé sur Groq pour accélérer les tâches d'IA comme le codage
1The Information AI 

Nvidia dévoile un système de puces basé sur Groq pour accélérer les tâches d'IA comme le codage

Nvidia a dévoilé un nouveau système de serveurs IA intégrant la technologie du fabricant de puces Groq, dont la licence a été acquise l'an dernier. Annoncé par le PDG Jensen Huang, ce système vise à rendre les serveurs IA plus économes en énergie et moins coûteux pour des tâches comme la génération de code. Il s'agit de la première fois que Nvidia intègre la technologie d'une autre entreprise dans ses puces.

OutilsActu
1 source
DLSS 5 ressemble à un filtre IA génératif en temps réel pour les jeux vidéo
2The Verge AI 

DLSS 5 ressemble à un filtre IA génératif en temps réel pour les jeux vidéo

Nvidia a annoncé DLSS 5 lors de sa conférence GTC, une mise à jour qui intègre l'IA générative au rendu graphique en temps réel dans les jeux vidéo. Le PDG Jensen Huang la décrit comme "le moment GPT du graphisme", promettant des améliorations notables de l'éclairage et des ombres. La mise à jour divise déjà la communauté : certains saluent le bond en réalisme visuel, d'autres critiquent une altération inacceptable de l'intention artistique des créateurs.

OutilsOutil
1 source
NVIDIA et Google Cloud misent sur la prochaine génération de créateurs en IA
3NVIDIA AI Blog 

NVIDIA et Google Cloud misent sur la prochaine génération de créateurs en IA

À l'occasion de Google I/O 2026, NVIDIA et Google Cloud ont annoncé une série de nouvelles ressources pour leur communauté de développeurs commune, qui regroupe désormais plus de 100 000 membres. Lancée lors de Google I/O l'année précédente, cette communauté réunit développeurs, data scientists et ingénieurs en machine learning autour de l'écosystème NVIDIA sur Google Cloud. Parmi les nouveautés dévoilées cette année : un parcours d'apprentissage dédié à la bibliothèque JAX sur GPU NVIDIA, un codelab centré sur NVIDIA Dynamo pour l'optimisation de l'inférence, ainsi que des livestreams mensuels. Les développeurs peuvent désormais déployer des applications multi-agents en combinant les modèles ouverts Gemma 4 de Google DeepMind, les modèles NVIDIA Nemotron et le Google Agent Development Kit, sur des machines virtuelles G4 de Google Cloud équipées de GPU NVIDIA RTX PRO 6000 Blackwell, via Google Cloud Run ou des instances spot. Le nouveau parcours JAX et le codelab NVIDIA Dynamo sur GKE seront disponibles le mois prochain pour les membres de la communauté. Ces annonces ont un impact direct pour les équipes techniques qui cherchent à passer du prototype à la production rapidement. En combinant des modèles ouverts, des bibliothèques accélérées comme cuDF dans Google Colab Enterprise ou Dataproc, et une infrastructure GPU de dernière génération, les développeurs disposent d'un pipeline complet pour construire des applications d'IA prêtes pour la production : des systèmes RAG (retrieval-augmented generation) sur GKE aux pipelines de données d'entreprise en passant par l'analyse sportive. La collaboration sur JAX, framework de calcul numérique utilisé notamment par Google DeepMind pour l'entraînement de grands modèles, étend ces optimisations jusqu'à la plateforme Google Cloud AI Hypercomputer et au framework MaxText, permettant de passer d'expériences sur un seul GPU à des déploiements multi-rack avec une expérience cohérente. L'un des volets les plus significatifs du partenariat concerne l'IA responsable : NVIDIA est le premier partenaire industriel à avoir collaboré avec Google DeepMind sur SynthID, une technologie de tatouage numérique qui intègre des filigranes robustes directement dans les contenus générés par l'IA. Cette technologie est appliquée aux modèles Cosmos de NVIDIA, des modèles de fondation dédiés à la perception 3D et à la simulation pour robots et systèmes autonomes, disponibles sur build.nvidia.com. Dans un contexte où les agents IA combinent de plus en plus modèles propriétaires et open source pour raisonner et agir de manière autonome, cette couche de transparence devient un enjeu central pour la confiance des organisations qui déploient ces systèmes à grande échelle.

UELa technologie SynthID de filigrane numérique, développée avec Google DeepMind et intégrée aux modèles NVIDIA, répond directement aux obligations de transparence de l'AI Act européen sur les contenus générés par IA (Article 50).

OutilsOutil
1 source
Amazon Nova Act accélère la livraison logicielle grâce à l'automatisation des tests par agents
4AWS ML Blog 

Amazon Nova Act accélère la livraison logicielle grâce à l'automatisation des tests par agents

Amazon a lancé Nova Act, un service AWS conçu pour automatiser les tests d'assurance qualité (QA) dans les pipelines de livraison logicielle. Contrairement aux frameworks traditionnels qui s'appuient sur des sélecteurs CSS, des identifiants d'éléments ou des références structurelles pour naviguer dans les interfaces, Nova Act utilise un modèle de compréhension visuelle et le langage naturel — exactement comme le ferait un utilisateur humain. La solution s'accompagne de QA Studio, une interface de référence incluant un frontend web, une API et une CLI, construite sur une infrastructure serverless AWS. Les équipes peuvent y créer des suites de tests via un assistant de parcours utilisateur, déclencher des exécutions à la demande, les planifier ou les intégrer directement dans leurs pipelines CI/CD. L'ensemble s'appuie sur Amazon Bedrock AgentCore Browser pour la prévisualisation en direct et AWS Secrets Manager pour la saisie sécurisée des données sensibles. L'enjeu est considérable pour les équipes produit et engineering. Dans les organisations actuelles, les critères d'acceptance sont définis par les product managers en langage métier, implémentés par les développeurs, puis retranscrits en code d'automatisation — souvent par ces mêmes développeurs. Ce fossé entre ceux qui comprennent les besoins utilisateurs et ceux qui maintiennent les tests crée une dette technique permanente : chaque refactoring d'interface ou ajustement de layout casse des dizaines de tests, même quand les fonctionnalités restent intactes. Nova Act supprime ce goulot d'étranglement en permettant à n'importe quel membre de l'équipe — y compris des non-développeurs — de rédiger et maintenir des tests en langage naturel. Quand un designer déplace un bouton ou qu'un développeur restructure un composant React, les tests s'adaptent automatiquement sans intervention manuelle. Cette annonce s'inscrit dans une course plus large des grands fournisseurs cloud à proposer des agents capables d'interagir avec des interfaces graphiques. OpenAI avec Operator, Anthropic avec Computer Use, et désormais AWS avec Nova Act ciblent tous le même marché : remplacer les scripts d'automatisation fragiles par des agents visuels autonomes. Pour AWS, l'intégration native dans l'écosystème Bedrock et les services managés représente un avantage compétitif face aux solutions standalone. Le marché du test logiciel automatisé pèse plusieurs milliards de dollars et souffre d'un taux d'échec élevé des projets d'automatisation traditionnels — souvent abandonnés après quelques mois faute de ressources pour maintenir les scripts. Si Nova Act tient ses promesses de résilience aux changements UI, il pourrait redistribuer significativement les cartes dans ce secteur et accélérer l'adoption de l'approche "shift-left" où les tests sont écrits dès la définition des exigences.

UELes équipes engineering européennes utilisant AWS peuvent intégrer Nova Act dans leurs pipelines CI/CD, mais aucun impact réglementaire ou institutionnel direct sur la France ou l'UE.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic