Dossier NVIDIA — page 14

657 articles · page 14 sur 14

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

651IEEE Spectrum AI RobotiqueActu

L'avenir de l'IA physique passe par des interfaces plus intelligentes, pas des robots plus capables

Wetour Robotics avance que le prochain saut architectural de l'IA physique ne viendra pas des robots eux-mêmes, mais de la façon dont les humains leur communiquent leurs intentions. La startup a développé une approche qu'elle nomme Spatial Intent Fusion : la fusion en temps réel de trois flux d'information centrés sur l'humain, à savoir la position spatiale du corps, le contexte visuel capté par la caméra, et l'intention gestuelle détectée via capteurs musculaires. Ces trois canaux sont traités simultanément par une plateforme matérielle appelée Orchestra, un hub portable embarqué sur processeur NVIDIA Jetson Orin Nano Super, capable d'exécuter l'intégralité de la boucle de contrôle en local, sans dépendance au cloud. Le résultat est traduit en commandes directes pour n'importe quel appareil physique connecté, avec une latence assez basse pour que le système réponde comme une extension naturelle du corps. L'enjeu est concret : les interfaces actuelles, écrans, boutons et commandes vocales, supposent que l'utilisateur peut s'arrêter, regarder vers le bas et formuler une instruction structurée. Cette hypothèse s'effondre dès que le travail se déroule dans un environnement réel. Un technicien de maintenance sur une éolienne, harnais accroché et les deux mains sur une clé, n'a pas la liberté de consulter un écran. Un opérateur logistique sur un quai de chargement, les yeux sur la palette et les mains gantées, ne peut pas dicter une commande vocale dans le bruit ambiant. Une personne en fauteuil motorisé dans une rue animée veut ajuster sa trajectoire sans sortir son téléphone. Pour Wetour Robotics, chaque canal observé isolément, un geste seul, un regard seul, reste ambigu. C'est la fusion de ces canaux au niveau système, avec une inférence d'intention robuste, qui rend l'interface fiable dans des conditions dégradées. Cette approche s'inscrit dans un constat plus large que l'industrie commence à formuler. Depuis trois ans, les progrès côté robot ont été spectaculaires : Boston Dynamics, Figure, Unitree ont repoussé les limites de la locomotion et de la dextérité, tandis que Google DeepMind a redéfini ce que les modèles vision-langage-action peuvent accomplir en environnement non structuré. Mais la boucle humain-machine n'a pas évolué au même rythme. Les mêmes trois modalités d'entrée dominent depuis quarante ans. Wetour Robotics parie que le vrai goulot d'étranglement se situe désormais du côté humain, et que faire de l'opérateur un noeud à part entière du réseau de calcul, avec la même qualité de participation que les capteurs embarqués sur le robot, constitue le prochain levier de performance. Le positionnement commercial de la société résume l'ambition en une formule : votre corps est l'interface.

1 source

652NVIDIA AI Blog

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Les centres de données d'entreprise sont en train de vivre une mutation profonde : autrefois dédiés au stockage et au traitement de données, ils deviennent des usines à tokens, dont la production principale est l'intelligence artificielle générée à la demande. Cette transformation oblige les entreprises à repenser entièrement leur manière d'évaluer le coût total de possession (TCO) de leur infrastructure IA. Or, selon NVIDIA, la majorité des décideurs continuent de se focaliser sur des métriques obsolètes : le coût par GPU par heure ou les FLOPS par dollar, c'est-à-dire la puissance brute de calcul obtenue pour chaque dollar investi. Ces indicateurs mesurent des intrants, alors que les entreprises, elles, font tourner leur activité sur des extrants. La seule métrique qui compte réellement est le coût par million de tokens produits, soit le coût tout compris pour générer chaque unité d'intelligence délivrée à l'utilisateur final. Optimiser ce coût par token change fondamentalement l'équation économique de l'IA. Le numérateur de cette équation, le coût horaire du GPU, est visible et facile à comparer entre fournisseurs cloud ou solutions on-premise. Mais c'est le dénominateur, soit le volume de tokens effectivement délivrés par seconde, qui détermine la rentabilité réelle. Augmenter ce débit produit deux effets simultanés : il réduit le coût unitaire de chaque interaction servie, améliorant ainsi les marges, et il augmente le nombre de tokens par mégawatt consommé, ce qui permet de générer davantage de revenus à partir du même investissement infrastructurel. NVIDIA affirme proposer le coût par token le plus bas du secteur, notamment sur les modèles de raisonnement de type mixture-of-experts (MoE), qui représentent aujourd'hui la catégorie de modèles la plus largement déployée en production. Cette réévaluation des critères de choix s'inscrit dans un contexte de montée en puissance de l'IA agentique, où les systèmes autonomes enchaînent des séquences longues d'inférences, rendant le débit et la latence encore plus critiques. Des technologies comme le décodage spéculatif, la prédiction multi-token, le routage KV-aware ou encore le déchargement du cache KV permettent d'augmenter substantiellement le débit réel sans changer le matériel. La prise en charge de la précision FP4, la capacité de l'interconnexion à gérer le trafic all-to-all des modèles MoE, ou encore les optimisations de la couche de serving deviennent des critères de sélection déterminants. Pour les déploiements on-premise notamment, où l'engagement en capital sur le foncier, l'énergie et l'infrastructure est massif, maximiser l'intelligence produite par mégawatt n'est plus une option technique mais un impératif économique.

InfrastructureActu

1 source

653AI News

Nouvel alliance pour offrir des robots intelligents dans des environnements à haut risque

ADLINK Technology et Under Control Robotics (derrière la startup Noble Machines) ont conclu un partenariat stratégique pour développer une nouvelle génération de robots humanoïdes bipèdes destinés aux environnements industriels dangereux. Leur solution combinera la plateforme edge AI DLAP d'ADLINK (basée sur NVIDIA Jetson Thor) avec le logiciel d'autonomie et de contrôle corporel de Noble Machines, pour des robots capables de percevoir, raisonner et manipuler des charges lourdes en conditions extrêmes. Les secteurs cibles initiaux incluent la construction, les mines, l'énergie et la pétrochimie — des industries confrontées à des pénuries de main-d'œuvre et à des risques élevés pour les travailleurs humains.

RobotiqueActu

1 source

654Le Big Data

OpenAI et Oracle abandonnent l'extension du campus Stargate au Texas

OpenAI et Oracle ont abandonné leur projet d'extension du campus Stargate d'Abilene (Texas), qui devait porter la capacité de 1,2 à 2 gigawatts. Cette décision fait suite à des obstacles de financement, des retards d'approvisionnement en électricité, une panne du système de refroidissement liée au froid hivernal, et des tensions avec le partenaire infrastructure Crusoe. Les deux groupes préfèrent désormais développer de nouveaux sites ailleurs aux États-Unis, potentiellement équipés de puces Nvidia Vera Rubin plus récentes, ce qui fragilise la crédibilité du projet Stargate estimé à 500 milliards de dollars.

BusinessActu

1 source

655MarkTechPost

Andrej Karpathy publie « Autorecherche », un outil Python de 630 lignes permettant aux agents IA de mener des expériences de ML en autonomie sur un seul GPU

Andrej Karpathy a publié autoresearch, un outil Python minimaliste de 630 lignes permettant à des agents IA de mener des expériences de machine learning en totale autonomie sur un seul GPU NVIDIA. L'agent lit des instructions en Markdown, modifie le code d'entraînement (architecture, optimiseurs, hyperparamètres), exécute des runs de 5 minutes et ne conserve les changements que si le score bits-per-byte (BPB) s'améliore — Karpathy a ainsi démontré une réduction de la perte de validation de 1,0 à 0,97 BPB. Le PDG de Shopify, Tobi Lutke, a rapidement adapté le framework pour un projet interne, obtenant une amélioration de 19 % des scores de validation, avec un petit modèle optimisé par l'agent surpassant un modèle plus grand configuré manuellement.

OutilsOutil

1 source

656OpenAI Blog

Présentation de Stargate UK

OpenAI, NVIDIA et Nscale ont lancé Stargate UK, un partenariat souverain en intelligence artificielle fournissant jusqu'à 50 000 GPU et le superordinateur le plus puissant du Royaume-Uni. Ce projet vise à accélérer l'innovation en IA, améliorer les services publics et stimuler la croissance économique du pays.

BusinessActu

1 source

657HuggingFace Blog

Critiques de règles: Un modèle d'apprentissage automatique sous la loupe

Bienvenue à NVIDIA Llama Nemotron Nano VLM sur le Hugging Face Hub. NVIDIA présente une nouvelle version miniature de son modèle de traitement du langage, offrant des performances optimisées pour les appareils mobiles. Ce modèle, appelé Nemotron Nano, est maintenant disponible sur la plateforme Hugging Face Hub, permettant aux développeurs d'intégrer facilement ces capacités avancées dans leurs applications.

OutilsOutil

1 source