Dossier NVIDIA — page 2

296 articles · page 2 sur 6

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

51NVIDIA Developer Blog AutreOpinion

IA embarquée : optimiser la mémoire pour faire tourner de grands modèles sur NVIDIA Jetson

L'article source est tronqué (coupé après le premier paragraphe). Je vais rédiger à partir du contenu visible et des faits techniques documentés sur ce sujet, en restant factuel. --- La démocratisation des modèles d'IA générative open source crée une nouvelle pression sur les plateformes embarquées : les développeurs veulent désormais faire tourner des modèles de plusieurs milliards de paramètres directement sur des robots et agents autonomes opérant dans le monde physique, sans connexion permanente au cloud. Sur les modules NVIDIA Jetson Orin, la contrainte principale est la mémoire unifiée partagée entre CPU et GPU, plafonnée à 64 Go sur le Jetson AGX Orin et à 8 ou 16 Go sur les variantes Orin NX et Nano. Des techniques comme la quantification INT4 et INT8 via TensorRT-LLM, le paged KV cache et le flash attention permettent de faire tourner des modèles comme Llama 3 8B, Mistral 7B ou Phi-3 sur ces plateformes avec des compromis mesurés sur la précision. L'enjeu n'est pas académique : pour les intégrateurs robotiques et les OEM industriels, la capacité à exécuter un VLA (Vision-Language-Action model) localement sans latence réseau est un prérequis pour la manipulation en environnement non structuré, l'inspection autonome ou la navigation en entrepôt. La quantification agressive réduit l'empreinte mémoire d'un facteur 4 à 8x par rapport au FP16, mais introduit une dégradation de précision qu'il faut valider tâche par tâche. NVIDIA positionne cette optimisation comme un élément central de sa stack Physical AI via l'écosystème Isaac ROS. La plateforme Jetson est déployée dans des centaines de produits robotiques en production, des AMR d'entrepôt aux bras collaboratifs et drones d'inspection industrielle. Sur le segment concurrent, Qualcomm pousse ses puces RB3/RB5 avec le moteur Hexagon NPU, et Hailo (Israël) vise spécifiquement l'inférence embarquée légère. La prochaine étape pour NVIDIA sera l'intégration native de GR00T N2, son modèle de fondation humanoïde, sur Jetson Thor, une puce annoncée pour les robots humanoïdes haut de gamme et attendue dans les déploiements pilotes courant 2025-2026.

Dossier NVIDIA — page 2

IA embarquée : optimiser la mémoire pour faire tourner de grands modèles sur NVIDIA Jetson

NVIDIA lance Ising : sa première famille de modèles d'IA quantique ouverts pour systèmes hybrides quantique-classique

NVIDIA et l'Université du Maryland lancent Audio Flamingo Next (AF-Next), un grand modèle audio-langage ouvert et puissant

Tutoriel NVIDIA PhysicsNeMo : Darcy Flow, FNOs, PINNs, modèles de substitution et benchmarking d'inférence

DustPhotonics : La nouvelle cible prioritaire d’Intel et Nvidia dans l’IA

NVIDIA lance AITune : un outil open source qui identifie automatiquement le backend d'inférence le plus rapide pour tout modèle PyTorch

Guide de code complet sur NVIDIA KVPress : inférence LLM à contexte long et compression du cache KV

Guide pratique : utiliser le Transformer Engine NVIDIA avec précision mixte, vérifications FP8 et exécution de secours

Guide pas à pas : pipeline d'optimisation de modèles avec NVIDIA Model Optimizer, élagage FastNAS et affinage

Nvidia bat des records MLPerf avec 288 GPU pendant qu'AMD et Intel se concentrent sur d'autres fronts

La Corée du Sud investit dans la startup locale qui défie Nvidia avec ses puces IA

L'efficacité à grande échelle : NVIDIA et les acteurs de l'énergie accélèrent les centres d'IA flexibles pour renforcer le réseau électrique

NVIDIA AI présente ProRL Agent : une infrastructure d'apprentissage par renforcement pour agents LLM à grande échelle

Après le trafic de puces IA vers la Chine, Nvidia est à nouveau sous pression

« L’AGI est déjà là » : la phrase choc de NVIDIA qui fait l’effet d’un séisme

« Je pense qu’on a atteint l’intelligence artificielle générale » : le patron de Nvidia surprend tout le monde avec cette phrase

NVIDIA fait don d'un pilote d'allocation dynamique de ressources GPU à la communauté Kubernetes pour faire avancer l'IA open source

Nvidia : Jensen Huang déclare avoir atteint l'AGI

Comment les agents IA autonomes deviennent sécurisés par conception grâce à NVIDIA OpenShell

L'NVIDIA RTX PRO 6000 Blackwell Workstation Edition transforme la data science

DLSS 5 : date de sortie, cartes compatibles, rendu neuronal… Tout savoir sur la technologie de Nvidia

Ce qui s'est passé au GTC de Nvidia : NemoClaw, le robot Olaf et un pari à 1 000 milliards de dollars

Le directeur de la robotique de Nvidia : les agents IA vont provoquer un moment ChatGPT pour la robotique

Exécutez NVIDIA Nemotron 3 Super sur Amazon Bedrock

Nvidia DLSS : avantages, fonctionnement, performances… Quand l’IA vient au secours de vos jeux

IA : NVIDIA et Oracle franchissent un cap décisif dans la vitesse de traitement des données

L'atelier Build-A-Claw de Nvidia

Space-1 Vera Rubin : pourquoi Nvidia déploie ses GPU dans l’espace (et comment ils y survivent)

NemoClaw : NVIDIA veut sécuriser OpenClaw, la plateforme d’agents IA qui a conquis la tech

NVIDIA AI publie 'OpenShell' en open source : un environnement d'exécution sécurisé pour les agents IA autonomes

Nvidia reprend la fabrication pour les ventes du H200 en Chine, selon son PDG

Le PDG de Nvidia : le risque d'investissement dans les néoclouds est « extrêmement faible »

GeForce RTX : avec DLSS 5 et son rendu photoréaliste, l’IA de NVIDIA va-t-elle trop loin ?

Nvidia craque pour OpenClaw

OpenClaw séduit massivement, Nvidia veut désormais le rendre plus sûr

Comment NTT DATA et NVIDIA accélèrent le déploiement de l’IA en entreprise

Comment Nvidia NemoClaw compte sécuriser les agents OpenClaw ?

BYD et Geely sous perfusion Nvidia : la tech américaine gagne en Chine pour la conduite autonome de niveau 4

Nvidia lance le DLSS 5 : impressionnant, mais déjà sujet aux polémiques

Derrière le trillion de dollars attendu pour 2027, NVIDIA étend son emprise sur l’infrastructure de l’IA

Avec DLSS 5, l’IA de Nvidia fabrique désormais les images des jeux vidéo

Nvidia dévoile une pile OpenClaw plus sécurisée pour les entreprises

La version OpenClaw de Nvidia pourrait résoudre son plus grand problème : la sécurité

Le PDG de Nvidia table sur 1 000 milliards de dollars de revenus en puces d'ici 2027

AWS et NVIDIA renforcent leur collaboration stratégique pour accélérer le passage de l'IA du pilote à la production

NVIDIA DSX Air accélère le temps de génération des tokens grâce à la simulation pour les usines d'IA

Comment regarder le keynote de Jensen Huang à la GTC 2026 de Nvidia — et ce qu'il faut en attendre

NTT DATA et NVIDIA déploient des usines d'IA d'entreprise à grande échelle

NVIDIA lance Nemotron 3 Super : un modèle open source hybride Mamba-Attention MoE de 120 milliards de paramètres offrant un débit 5 fois supérieur pour l'IA agentique

NVIDIA AI dévoile Nemotron-Terminal : un pipeline systématique d'ingénierie des données pour le passage à l'échelle des agents LLM en terminal