Aller au contenu principal

Dossier NVIDIA — page 4

710 articles · page 4 sur 15

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia
151Frandroid RobotiqueOpinion

« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia

Un cadre dirigeant de Nvidia a affirmé que le nombre de robots sur Terre dépassera un jour celui des êtres humains, prédisant l'émergence de dizaines de milliards d'appareils dans un horizon de dix à vingt ans. Cette déclaration, rapportée par Frandroid, illustre l'ambition vertigineuse avec laquelle le géant américain des semi-conducteurs positionne désormais la robotique physique au coeur de sa stratégie de croissance. L'enjeu dépasse largement la provocation chiffrée : Nvidia cherche à s'imposer comme la colonne vertébrale computationnelle de la prochaine vague industrielle. L'entreprise a déjà lancé Project GR00T, un modèle fondateur pour robots humanoïdes, et sa plateforme Isaac pour la simulation et l'entraînement robotique. Si des dizaines de milliards de robots nécessitent des puces, des logiciels et des infrastructures d'entraînement, Nvidia se retrouve en position de fournisseur incontournable, reproduisant à l'échelle physique le rôle qu'elle joue aujourd'hui dans l'IA générative. Cette prédiction s'inscrit dans une course mondiale où Tesla, Figure AI, 1X Technologies et Boston Dynamics parient tous sur l'humanoides à grande échelle. Les gouvernements chinois et américain y voient un enjeu de souveraineté industrielle. La question n'est donc plus de savoir si les robots envahiront les usines, les entrepôts et les foyers, mais à quelle vitesse, et qui contrôlera la chaîne de valeur, des capteurs aux modèles d'IA embarqués, en passant par les puces qui les font tourner.

1 source
Les géants industriels de Taiwan accélèrent le déploiement mondial de l'infrastructure IA avec NVIDIA
152NVIDIA AI Blog 

Les géants industriels de Taiwan accélèrent le déploiement mondial de l'infrastructure IA avec NVIDIA

Le workflow a été bloqué pour revue. Je fais la traduction directement. Taiwan abrite plus de 500 partenaires de l'écosystème NVIDIA, et c'est là que convergent plus d'un million de composants MGX destinés à la nouvelle infrastructure Vera Rubin, répartis sur 25 sites de production. Cette architecture de grande échelle implique l'ensemble de la chaîne d'approvisionnement : des acteurs de la fabrication de puces comme TSMC, SPIL, Kinsus, KYEC et UMTC aux géants de l'assemblage de serveurs que sont Foxconn, Pegatron, Quanta Cloud Technology (QCT), Wistron et Inventec. Mais ces industriels ne se contentent plus de construire l'infrastructure IA mondiale, ils l'appliquent à leurs propres usines. Foxconn déploie les blueprints NVIDIA Factory Operations et NemoClaw pour développer MoMClaw, un agent de gestion des opérations industrielles qui analyse en temps réel les signaux capteurs et machines, et fournit aux opérateurs des plans d'action en langage naturel. Les gains estimés sont substantiels : réduction de 80 % du temps d'analyse des causes racines, hausse de 15 % de la productivité, baisse de 10 % des pannes machines. La société construit par ailleurs un supercalculateur cloud à Taiwan pour 1,4 milliard de dollars, équipé de 10 000 GPU NVIDIA GB300 NVL72. L'enjeu dépasse la seule performance opérationnelle : Taiwan est en train de redéfinir ce que signifie construire de l'infrastructure IA à l'échelle industrielle. TSMC utilise les bibliothèques CUDA-X et des modèles IA pour la lithographie computationnelle, la simulation de transistors et le contrôle qualité, la bibliothèque cuLitho d'NVIDIA améliore le temps de cycle ou le coût de 20 à 50 % par rapport aux solutions CPU, tandis que cuEST accélère la simulation de matériaux semiconducteurs d'un facteur 50. QCT, de son côté, exploite des jumeaux numériques basés sur NVIDIA Omniverse pour planifier ses usines, et développe avec sa filiale Techman Robot un kit IA physique appuyé sur NVIDIA Jetson Thor et la plateforme Isaac GR00T, pour des robots humanoïdes comme le TM Xplore I, capables d'assembler des serveurs. Wistron simule des environnements de test thermique sur ses sites mondiaux grâce au framework PhysicsNeMo et à Cadence Reality DC Design. Cette dynamique s'inscrit dans une transition structurelle du secteur : NVIDIA ne se positionne plus seulement comme fournisseur de GPU, mais comme architecte d'un écosystème industriel intégré, où ses plateformes logicielles (Omniverse, Isaac, Metropolis, NeMo) pilotent autant la production que le produit final. Taiwan, qui concentre l'essentiel de la capacité mondiale de fabrication de semi-conducteurs avancés, devient ainsi le laboratoire grandeur nature de l'IA physique appliquée au manufacturing. Avec la montée en charge de Vera Rubin pour alimenter les "agentic AI factories" à l'échelle mondiale, la question n'est plus de savoir si l'IA va transformer l'industrie manufacturière, mais à quelle vitesse les acteurs qui ne participent pas à cet écosystème pourront rester compétitifs.

InfrastructureActu
1 source
Jensen Huang (NVIDIA) chez Dell Technologies World : la demande explose de façon exponentielle
153NVIDIA AI Blog 

Jensen Huang (NVIDIA) chez Dell Technologies World : la demande explose de façon exponentielle

Lors du Dell Technologies World, Jensen Huang, PDG de NVIDIA, a rejoint sur scène Michael Dell pour présenter une nouvelle génération d'infrastructures dédiées à l'IA agentique. Les deux dirigeants ont annoncé plusieurs serveurs inédits, dont le Dell PowerEdge XE9812, construit autour de la puce NVIDIA Vera Rubin NVL72, qui affiche un coût par token jusqu'à dix fois inférieur à celui de l'architecture Blackwell pour les déploiements d'inférence à grande échelle. À ses côtés, les serveurs PowerEdge XE9880L, XE9885L et XE9882L s'appuient sur les modules NVIDIA HGX Rubin NVL8, premiers systèmes Dell à adopter cette architecture, supportant jusqu'à 144 GPU par rack, avec des noeuds de calcul entièrement refroidis par liquide et des performances jusqu'à 5,5 fois supérieures au HGX B200. Du côté des processeurs, les PowerEdge M9822 et R9822 intègrent le CPU NVIDIA Vera, doté d'une bande passante mémoire de 1,2 To/s, capable d'exécuter des charges agentiques 50 % plus rapidement que les processeurs x86. Dell a également dévoilé le PowerRack, un système entièrement intégré, ainsi qu'une mise à jour de son AI Data Platform incluant le moteur Starburst, qui offre un débit SQL jusqu'à trois fois supérieur sur CPU Vera. Cinq mille entreprises, dont Lilly, Samsung et Honeywell, exploitent déjà des charges de travail IA sur des Dell AI Factories avec NVIDIA. Ces annonces s'inscrivent dans un contexte de demande explosive. Michael Dell a rappelé que les dépenses mondiales en infrastructure IA pourraient atteindre entre 3 000 et 4 000 milliards de dollars d'ici 2030, avec une consommation de tokens projetée en hausse de 3 400 % sur la même période. Jensen Huang a résumé la situation sans détour : "Nous sommes entrés dans l'ère de l'IA utile, c'est pourquoi la demande est parabolique, absolument parabolique." Pour les entreprises, l'enjeu est direct : réduire le coût de l'inférence pour rendre les agents autonomes économiquement viables en production, et non plus seulement dans des environnements pilotes. La vitesse sur les bases de données est particulièrement stratégique, car les agents IA interrogent en continu ces systèmes pour accomplir leurs tâches, rendant la performance CPU aussi critique que celle des GPU. Cette conférence marque une accélération nette dans la course aux infrastructures IA d'entreprise. NVIDIA et Dell s'inscrivent dans une compétition directe avec les géants du cloud -- Amazon, Google, Microsoft -- qui proposent leurs propres puces et services managés. L'argument central de Dell est de permettre aux entreprises de faire tourner leurs modèles frontières et leurs agents autonomes dans leur propre périmètre sécurisé, sans dépendre d'un fournisseur cloud. La génération Rubin succède à Blackwell, lancée en 2024, et la cadence s'accélère : NVIDIA a maintenu un rythme d'une nouvelle architecture tous les un à deux ans. Pour des groupes comme Honeywell ou Lilly, dont les données sont sensibles et les contraintes réglementaires fortes, la promesse d'une IA souveraine et haute performance constitue un argument de poids face aux offres cloud publiques.

UELes entreprises européennes soumises aux contraintes RGPD pourraient tirer parti de l'offre d'IA souveraine on-premise Dell/NVIDIA pour réduire leur dépendance aux clouds publics américains.

InfrastructureActu
1 source
NVIDIA et Ineffable Intelligence s'associent pour bâtir l'infrastructure de l'apprentissage par renforcement
154NVIDIA AI Blog 

NVIDIA et Ineffable Intelligence s'associent pour bâtir l'infrastructure de l'apprentissage par renforcement

NVIDIA et Ineffable Intelligence, le laboratoire d'IA londonien fondé par David Silver, l'architecte d'AlphaGo, ont annoncé un partenariat technique approfondi pour concevoir l'infrastructure nécessaire à l'apprentissage par renforcement à grande échelle. Des ingénieurs des deux sociétés travaillent conjointement sur la construction d'un pipeline d'entraînement optimisé, en démarrant sur la plateforme NVIDIA Grace Blackwell et en préparant l'intégration de la prochaine architecture Vera Rubin, encore inédite. Jensen Huang, fondateur et PDG de NVIDIA, a qualifié les systèmes d'apprentissage continu par expérience de "prochaine frontière de l'IA", tandis que Silver, sorti du mode furtif la semaine dernière seulement avec Ineffable Intelligence, entend pousser ce paradigme bien au-delà de ses applications actuelles. L'enjeu technique est significatif. Contrairement au pré-entraînement classique, qui consomme un jeu de données fixe de textes et d'images humaines, l'apprentissage par renforcement génère ses propres données en temps réel : l'agent agit, observe les résultats, évalue et se met à jour en boucle serrée. Ce mode de fonctionnement impose des contraintes très différentes sur les interconnexions, la bande passante mémoire et l'inférence. S'y ajoutent des formes d'expérience potentiellement étrangères au langage humain, ce qui pourrait nécessiter des architectures de modèles et des algorithmes d'entraînement entièrement nouveaux. Résoudre ces contraintes à l'échelle est ce que visent conjointement les deux équipes. David Silver est l'une des figures centrales de l'apprentissage par renforcement depuis des décennies : il a co-développé DQN chez DeepMind avant de concevoir AlphaGo, le premier programme à battre un champion du monde de go en 2016. Son raisonnement est direct : les chercheurs ont "largement résolu le problème facile de l'IA", soit apprendre à partir de ce que les humains savent déjà, mais le vrai défi reste de construire des systèmes capables de découvrir de nouvelles connaissances par eux-mêmes. Ce virage, de la donnée humaine vers la simulation et l'expérience autonome, est au coeur de la mission d'Ineffable Intelligence. Si le partenariat tient ses promesses, il pourrait débloquer une nouvelle génération d'agents capables de progresser dans des environnements complexes sans plafond de données humaines, ouvrant potentiellement des découvertes dans des domaines allant de la recherche scientifique à la robotique.

RecherchePaper
1 source
Sakana AI et NVIDIA présentent TwELL : accélération de 20,5 % en inférence et 21,9 % en entraînement pour les LLMs
155MarkTechPost 

Sakana AI et NVIDIA présentent TwELL : accélération de 20,5 % en inférence et 21,9 % en entraînement pour les LLMs

Des chercheurs de Sakana AI et NVIDIA ont publié en mai 2026 un article accepté à ICML 2026 (arXiv:2603.23198) présentant TwELL, un nouveau format de calcul creux accompagné de noyaux CUDA dédiés, permettant d'accélérer les grands modèles de langage de 20,5 % à l'inférence et de 21,9 % à l'entraînement. Le travail cible les couches feedforward des transformeurs, qui concentrent plus des deux tiers des paramètres d'un modèle et consomment plus de 80 % des opérations flottantes totales. Le constat de départ est frappant : pour n'importe quel token traité, plus de 99 % des neurones cachés dans ces couches produisent une valeur nulle après la fonction d'activation. Cette sparsité dite "d'activation" existe donc à grande échelle, mais n'avait jusqu'ici jamais pu être exploitée efficacement sur GPU. L'impact potentiel est considérable pour l'ensemble de l'industrie du calcul IA. Les GPU NVIDIA sont architecturés pour des multiplications matricielles denses via les Tensor Cores, qui exigent de larges blocs de données contiguës. Les formats creux classiques comme ELLPACK nécessitaient un passage kernel supplémentaire pour convertir les activations du format dense au format creux, une surcharge qui annulait tout gain. Les travaux précédents de sparsité dans les LLM, notamment TurboSparse, ProSparse et Q-Sparse, ne traitaient que les opérations GEMV à un seul token, un cas marginal en production. TwELL résout le problème réellement difficile : les opérations GEMM batchées avec des milliers de tokens simultanés, qui correspondent à la fois à l'inférence à haut débit et à l'entraînement. Un gain de 20 % sur ces régimes se traduit directement par des économies massives en coût de calcul et en consommation électrique pour quiconque opère des modèles à l'échelle. L'innovation technique centrale de TwELL réside dans un découpage des colonnes en tuiles horizontales correspondant exactement à la taille de tuile T_n du kernel de multiplication matricielle. Les valeurs non nulles sont compactées localement dans chaque tuile, et cette construction s'effectue dans l'épilogue du kernel de projection existant, sans kernel supplémentaire, sans lecture mémoire additionnelle ni synchronisation entre blocs. À l'inférence, un seul kernel fusionné lit les activations au format TwELL et effectue les projections montante et descendante conjointement, évitant d'écrire l'état caché intermédiaire en mémoire globale et réduisant ainsi drastiquement le trafic DRAM. Pour l'entraînement, un format hybride route dynamiquement chaque ligne vers une matrice ELL compacte ou vers un bloc dense de secours selon le taux de sparsité local. Ce travail ouvre la voie à des optimisations architecturales profondes sans modifier les poids ni les architectures existantes, une direction que d'autres laboratoires devraient rapidement explorer.

RecherchePaper
1 source
NVIDIA : le décodage spéculatif dans NeMo RL accélère la génération de 1,8× à 8B et vise 2,5× à 235B
156MarkTechPost 

NVIDIA : le décodage spéculatif dans NeMo RL accélère la génération de 1,8× à 8B et vise 2,5× à 235B

Des chercheurs de NVIDIA ont publié une étude intégrée à NeMo RL v0.6.0 qui accélère significativement la phase d'entraînement par renforcement des grands modèles de langage grâce au décodage spéculatif. Le principe repose sur un petit modèle dit "brouillon" qui propose plusieurs tokens en avance, tandis que le modèle principal, celui qu'on entraîne réellement, les vérifie via un mécanisme de rejet statistique. Sur 32 GPU GB200 (8 nœuds NVL72), cette approche réduit la latence de génération de 100 secondes à 56,6 secondes sur la tâche RL-Zero, soit un gain de 1,8× sur la génération. À l'échelle d'un modèle de 235 milliards de paramètres, les projections donnent un gain de bout en bout de 2,5×. Le framework EAGLE-3 est utilisé comme moteur de brouillon, compatible avec n'importe quel modèle pré-entraîné sans nécessiter de tête de prédiction multi-token native. Ce résultat est particulièrement précieux parce qu'il ne sacrifie rien à la fidélité d'entraînement. La génération par rollout représente entre 65 et 72 % du temps total d'une étape RL, mesure faite sur Qwen3-8B dans deux configurations, RL-Think et RL-Zero. C'est donc le seul goulet d'étranglement qui vaille la peine d'être attaqué. Or les méthodes habituelles d'accélération, exécution asynchrone, replay hors-politique, précision réduite, introduisent toutes un décalage de distribution qui contamine le signal d'entraînement. Le décodage spéculatif, lui, garantit mathématiquement que la distribution de sortie du modèle cible reste identique à ce qu'elle aurait été sans brouillon. Aucune correction hors-politique, aucun biais introduit dans la récompense. L'intégration dans une boucle d'entraînement par renforcement posait néanmoins un défi d'ingénierie non trivial : à chaque mise à jour des poids de la politique, le modèle brouillon doit rester aligné avec cette politique en évolution. NVIDIA a résolu cela avec une architecture à deux chemins dans NeMo RL, un chemin général via EAGLE-3 et un chemin natif pour les modèles disposant de têtes MTP intégrées. Lorsque l'adaptation en ligne du brouillon est activée, les états cachés et log-probabilités issus du passage avant du vérificateur MegatronLM sont réutilisés pour superviser la tête brouillon via un gradient détaché, de sorte que l'entraînement du brouillon n'interfère jamais avec le gradient de politique. Cette fonctionnalité est désormais disponible en production dans NeMo RL v0.6.0, aux côtés du backend SGLang, de l'optimiseur Muon et de l'entraînement long contexte YaRN.

💬 Le vrai problème du RLHF à grande échelle, c'est que 70% du temps tu le passes juste à générer des rollouts. NVIDIA s'y attaque proprement avec le décodage spéculatif dans NeMo : un modèle brouillon qui anticipe, un modèle principal qui valide, et la garantie mathématique que la distribution reste intacte, pas de biais hors-politique introduit en douce. 1,8× sur 8B, 2,5× visé sur 235B, c'est le genre d'optimisation qu'on attendait depuis qu'on fait du RL sérieusement.

LLMsPaper
1 source
L'équipe Qwen publie FlashQLA : une bibliothèque de noyaux d'attention linéaire atteignant jusqu'à 3x d'accélération sur les GPU NVIDIA Hopper
157MarkTechPost 

L'équipe Qwen publie FlashQLA : une bibliothèque de noyaux d'attention linéaire atteignant jusqu'à 3x d'accélération sur les GPU NVIDIA Hopper

L'équipe Qwen a publié FlashQLA, une bibliothèque open source de kernels GPU haute performance, sous licence MIT. Construite sur le framework de compilation TileLang, elle est spécifiquement optimisée pour le mécanisme d'attention linéaire Gated Delta Network (GDN), qui est au coeur des modèles hybrides Qwen3.5 et Qwen3.6. Sur les GPU NVIDIA de la génération Hopper (H100, H200), FlashQLA atteint une accélération de 2 à 3 fois sur la passe avant (inference et entraînement) et de 2 fois sur la passe arrière (calcul des gradients), par rapport à la bibliothèque de référence Flash Linear Attention (FLA) et ses kernels Triton. Ces gains reposent sur deux innovations principales documentées : un parallélisme de contexte intra-carte déclenché automatiquement par les propriétés mathématiques du gate exponentiel du GDN, et une reformulation algébrique optimisée pour les unités de calcul matérielles de l'architecture Hopper. Ces résultats ont une portée concrète pour quiconque entraîne ou déploie des modèles de langage sur des séquences longues. L'attention classique de type softmax souffre d'une complexité quadratique en O(n²) : doubler la longueur de la séquence multiplie le coût de calcul par quatre. L'attention linéaire ramène ce coût à O(n), ce qui rend le traitement de longs documents, de code ou de conversations beaucoup moins onéreux. Or, l'efficacité de l'attention linéaire dépend en grande partie de la qualité des kernels GPU sous-jacents. En exploitant les instructions warpgroup-level des Tensor Cores et les pipelines de données asynchrones propres à Hopper, fonctionnalités que Triton ne peut pas toujours exploiter pleinement, FlashQLA libère une partie du potentiel matériel que les implémentations existantes laissaient sur la table. Ce travail s'inscrit dans une compétition intense autour de l'optimisation bas niveau des modèles de langage, un terrain souvent invisible mais décisif. Depuis FlashAttention (2022), plusieurs équipes cherchent à accélérer les opérations d'attention directement au niveau du kernel, c'est-à-dire la routine de calcul qui s'exécute réellement sur le processeur graphique. Qwen, développé par Alibaba Cloud, a fait le choix d'une architecture hybride pour ses derniers modèles : des couches GDN alternent avec des couches d'attention complète, combinant efficacité sur les longues séquences et expressivité là où elle est le plus utile. En publiant FlashQLA sous MIT, l'équipe ouvre cette optimisation à l'ensemble de la communauté, y compris aux chercheurs et entreprises qui construisent des pipelines sur ces architectures hybrides. La prochaine étape probable est l'intégration dans les frameworks d'entraînement dominants comme vLLM ou SGLang, ce qui élargirait significativement l'impact de cette bibliothèque.

UEAucun impact direct, mais les chercheurs et entreprises européens disposant de GPU NVIDIA Hopper peuvent intégrer cette bibliothèque MIT pour accélérer l'entraînement et l'inférence de leurs modèles à attention linéaire.

LLMsOpinion
1 source
Le GPT-5.5 d'OpenAI propulse Codex sur l'infrastructure NVIDIA, déjà utilisée en interne
158NVIDIA AI Blog 

Le GPT-5.5 d'OpenAI propulse Codex sur l'infrastructure NVIDIA, déjà utilisée en interne

OpenAI a déployé GPT-5.5, son dernier modèle frontier, au coeur de Codex, son application de codage agentique. Ce modèle tourne sur les systèmes rack-scale NVIDIA GB200 NVL72, capables de délivrer un coût 35 fois inférieur par million de tokens et un débit 50 fois supérieur par seconde et par mégawatt par rapport à la génération précédente. Plus de 10 000 employés de NVIDIA, répartis dans tous les départements, ingénierie, juridique, marketing, finance, RH, ventes et opérations, utilisent déjà Codex propulsé par GPT-5.5 depuis quelques semaines. Les résultats sont concrets et mesurables : des cycles de débogage qui prenaient des jours se bouclent désormais en quelques heures, et des expérimentations qui nécessitaient des semaines aboutissent en une nuit sur des bases de code complexes et multi-fichiers. Des équipes livrent des fonctionnalités complètes à partir de simples instructions en langage naturel. L'impact dépasse le simple gain de productivité individuel. En rendant l'inférence de modèles frontier économiquement viable à l'échelle de l'entreprise, cette infrastructure change la donne pour toute organisation souhaitant intégrer des agents IA dans ses processus métier. Pour sécuriser ce déploiement, NVIDIA a doté chaque employé d'une machine virtuelle cloud dédiée connectée via SSH, dans laquelle l'agent Codex opère en sandbox avec une politique de rétention zéro donnée. Les agents n'accèdent aux systèmes de production qu'en lecture seule, garantissant auditabilité complète sans exposition des données internes. Jensen Huang, PDG et fondateur de NVIDIA, a incité l'ensemble de ses équipes à adopter l'outil dans un email interne : "Passons à la vitesse de la lumière. Bienvenue dans l'ère de l'IA." Ce lancement s'inscrit dans plus de dix ans de collaboration entre NVIDIA et OpenAI, une relation qui remonte à 2016 lorsque Jensen Huang avait livré en mains propres le premier supercalculateur DGX-1 au siège d'OpenAI à San Francisco. Depuis, les deux entreprises co-développent l'ensemble de la pile IA : NVIDIA était partenaire dès le premier jour pour le lancement du modèle open-weight gpt-oss d'OpenAI, en optimisant les poids du modèle pour TensorRT-LLM et des frameworks comme vLLM et Ollama. OpenAI s'est engagé à déployer plus de 10 gigawatts de systèmes NVIDIA pour sa prochaine infrastructure, mobilisant des millions de GPU pour l'entraînement et l'inférence dans les années à venir. Les deux sociétés sont également partenaires en co-conception matérielle, OpenAI contribuant au roadmap hardware de NVIDIA en échange d'un accès anticipé aux nouvelles architectures, ce qui a abouti à la mise en service commune du premier cluster de 100 000 GPU GB200 NVL72.

LLMsActu
1 source
NVIDIA lance Ising : sa première famille de modèles d'IA quantique ouverts pour systèmes hybrides quantique-classique
159MarkTechPost 

NVIDIA lance Ising : sa première famille de modèles d'IA quantique ouverts pour systèmes hybrides quantique-classique

NVIDIA a lancé Ising, la première famille de modèles d'IA quantique ouverts au monde, conçue pour aider chercheurs et entreprises à construire des processeurs quantiques capables de faire tourner des applications réelles. La famille comprend deux composants distincts : Ising Calibration, un modèle de langage visuel qui interprète en temps réel les mesures des processeurs quantiques et ajuste automatiquement le système pour le maintenir en fonctionnement optimal, réduisant les temps de calibration de plusieurs jours à quelques heures ; et Ising Decoding, disponible en deux variantes de réseau de neurones convolutif 3D optimisées respectivement pour la vitesse et la précision, qui effectuent le décodage d'erreurs quantiques en temps réel. Ising Decoding se montre jusqu'à 2,5 fois plus rapide et 3 fois plus précis que pyMatching, l'actuel standard open source du secteur. Dès le premier jour, des organisations comme IonQ, IQM Quantum Computers, Infleqtion, le Fermi National Accelerator Laboratory, Harvard, Sandia National Laboratories, l'Université de Chicago et une douzaine d'autres acteurs académiques et commerciaux ont déjà adopté ces outils. L'enjeu est considérable : le principal frein au déploiement concret de l'informatique quantique n'est pas la puissance brute des processeurs, mais leur extrême sensibilité aux perturbations extérieures. Les qubits, unités de calcul fondamentales, accumulent des erreurs à une vitesse qui rend tout calcul utile quasiment impossible sans une calibration rigoureuse et une correction d'erreurs en temps réel. Ces deux opérations étaient jusqu'ici manuelles, lentes et difficiles à mettre à l'échelle. En automatisant ces processus critiques par l'IA, NVIDIA s'attaque directement au goulot d'étranglement qui sépare les démonstrateurs de laboratoire des machines véritablement opérationnelles. Une réduction des temps de calibration de plusieurs jours à quelques heures représente un gain de productivité transformateur pour les équipes de recherche. Ising s'inscrit dans la stratégie plus large de NVIDIA pour positionner ses GPU au coeur de l'informatique hybride quantique-classique. Les modèles Ising complètent CUDA-Q, la plateforme logicielle de NVIDIA pour les workflows hybrides, et s'intègrent avec NVQLink, l'interconnexion matérielle GPU-QPU développée par l'entreprise pour permettre une communication à faible latence entre processeurs graphiques et unités quantiques. Cette approche suit la même philosophie que CUDA pour l'accélération GPU : coupler étroitement calcul classique et calcul accéléré. Alors que des acteurs comme IBM, Google et des startups spécialisées investissent massivement dans la course au quantique, NVIDIA parie sur une stratégie de plateforme transversale, agnostique aux technologies de qubits, qui lui permet de s'imposer comme couche d'infrastructure indispensable quelle que soit la technologie gagnante.

UEIQM Quantum Computers (Finlande, UE) figure parmi les premiers adoptants, ce qui pourrait accélérer le développement de processeurs quantiques en Europe.

💬 La calibration des qubits qui passe de plusieurs jours à quelques heures, c'est le vrai goulot d'étranglement du quantique, et c'est la première fois qu'on voit une solution à la hauteur du problème. NVIDIA fait exactement ce qu'ils ont fait avec CUDA : s'imposer comme couche d'infra incontournable avant même de savoir quelle technologie va gagner. Harvard, Fermi Lab, IQM dès le premier jour, ça ne s'invente pas.

InfrastructureActu
1 source
Tutoriel NVIDIA PhysicsNeMo : Darcy Flow, FNOs, PINNs, modèles de substitution et benchmarking d'inférence
160MarkTechPost 

Tutoriel NVIDIA PhysicsNeMo : Darcy Flow, FNOs, PINNs, modèles de substitution et benchmarking d'inférence

NVIDIA a publié PhysicsNeMo, une bibliothèque dédiée à l'apprentissage automatique informé par la physique, et un tutoriel complet en montre l'implémentation pratique sur Google Colab. Le guide couvre l'ensemble du pipeline scientifique : génération de données pour le problème de l'écoulement de Darcy 2D, entraînement de modèles avancés dont l'opérateur de Fourier neuronal (FNO) et un réseau convolutif de base, ainsi qu'une introduction aux réseaux de neurones informés par la physique (PINNs). Le tutoriel se conclut par une comparaison d'architectures, une évaluation des prédictions et un benchmark d'inférence, avec sauvegarde des modèles entraînés. Techniquement, le problème de Darcy 2D sert de cas d'école : il s'agit de résoudre l'équation -∇·(k(x,y)∇u(x,y)) = f(x,y) sur un domaine carré de résolution 64×64, où k représente le champ de perméabilité en entrée et u le champ de pression en sortie, les données étant générées via des champs aléatoires gaussiens et un solveur par différences finies. Ce type d'outil intéresse directement les ingénieurs et chercheurs qui travaillent sur des simulations physiques coûteuses en calcul. Les opérateurs neuronaux comme le FNO peuvent apprendre des solutions d'équations aux dérivées partielles sans résoudre le système à chaque fois, réduisant les temps de calcul de plusieurs ordres de grandeur par rapport aux solveurs classiques. Pour des domaines comme la modélisation des écoulements souterrains, la conduction thermique, la mécanique des fluides ou la conception de matériaux, ces modèles de substitution (surrogate models) permettent d'explorer des milliers de scénarios là où un simulateur numérique traditionnel n'en traiterait que quelques dizaines dans le même temps. Le benchmark d'inférence inclus dans le tutoriel permet de quantifier précisément ce gain. PhysicsNeMo s'inscrit dans une tendance de fond portée par NVIDIA depuis plusieurs années : outiller la communauté scientifique avec des frameworks qui combinent deep learning et contraintes physiques. La bibliothèque fait écho à d'autres initiatives similaires comme DeepMind's GraphCast pour la météo ou les travaux de Microsoft sur les modèles de simulation climatique. L'enjeu est de démocratiser la scientific machine learning en abaissant la barrière d'entrée technique : en proposant une implémentation fonctionnelle sur Colab, accessible sans infrastructure GPU dédiée pour les premiers tests, NVIDIA cible aussi bien les doctorants en physique computationnelle que les équipes R&D industrielles. Le fait que le tutoriel propose des implémentations de secours (fallback) lorsque PhysicsNeMo n'est pas disponible suggère une conception pensée pour la robustesse et l'adoption progressive dans des environnements de production variés.

OutilsTuto
1 source
DustPhotonics : La nouvelle cible prioritaire d’Intel et Nvidia dans l’IA
161Le Big Data 

DustPhotonics : La nouvelle cible prioritaire d’Intel et Nvidia dans l’IA

La start-up israélienne DustPhotonics, fondée en 2017 et spécialisée dans les puces photoniques, serait en négociations avancées pour un rachat estimé à plusieurs centaines de millions de dollars. Intel, Nvidia et Amazon figurent parmi les acheteurs potentiels les plus sérieux, selon des informations publiées le 12 avril 2026 par le média israélien Calcalist. L'entreprise, qui a levé plus de 100 millions de dollars depuis sa création, développe des composants capables de transmettre des données à des vitesses comprises entre 400 Gbit/s et 1,6 Tbit/s en utilisant la lumière plutôt que l'électricité. En 2021, sous l'impulsion de son PDG Ronnen Lovinger, DustPhotonics a opéré un pivot stratégique en abandonnant les émetteurs-récepteurs et câbles pour se concentrer exclusivement sur le développement de puces intégrées, ce qui lui a permis de monter significativement en valeur dans la chaîne technologique. L'enjeu dépasse largement cette seule transaction. Les câbles en cuivre qui relient les processeurs dans les grands centres de données atteignent leurs limites physiques face aux exigences croissantes des clusters d'IA : latence trop élevée, consommation énergétique excessive, bande passante insuffisante. Les goulets d'étranglement ne se situent plus uniquement dans les GPU ou la mémoire, mais dans la circulation de l'information entre les composants. La photonique sur silicium, qui intègre directement des composants optiques dans les puces, s'impose comme une réponse structurelle à ce problème. Pour Nvidia, acquérir DustPhotonics permettrait d'internaliser une technologie critique et de réduire sa dépendance à des fournisseurs externes comme Coherent, avec qui le groupe a déjà contracté des engagements de plusieurs milliards de dollars. Amazon viserait une intégration directe dans ses infrastructures cloud, tandis qu'Intel chercherait à combler son retard dans la course à l'IA. La crédibilité de DustPhotonics repose aussi sur son actionnariat. Son président, Avigdor Willenz, a déjà orchestré deux sorties majeures : la vente de Habana Labs à Intel et celle d'Annapurna Labs à AWS, deux transactions qui ont rapporté plusieurs milliards de dollars. Ce palmarès renforce la probabilité d'un nouvel exit réussi. L'entreprise n'évolue pas seule sur ce marché en effervescence, Ayar Labs et Xscape Photonics développent des approches concurrentes, mais son positionnement sur les puces intégrées à haute vitesse la distingue. La consolidation autour des interconnexions optiques s'accélère à mesure que les géants technologiques cherchent à sécuriser chaque brique critique de leur infrastructure IA, un mouvement qui devrait s'intensifier dans les prochains mois.

InfrastructureOpinion
1 source
NVIDIA lance AITune : un outil open source qui identifie automatiquement le backend d'inférence le plus rapide pour tout modèle PyTorch
162MarkTechPost 

NVIDIA lance AITune : un outil open source qui identifie automatiquement le backend d'inférence le plus rapide pour tout modèle PyTorch

NVIDIA a lancé AITune, un outil open source destiné à automatiser l'optimisation des modèles PyTorch pour l'inférence sur GPU. Disponible sous licence Apache 2.0 et installable via PyPI, cet outil s'adresse aux équipes qui déploient des modèles de deep learning en production et qui souhaitent éviter le travail d'ingénierie manuel habituellement requis pour choisir et configurer les backends d'optimisation. AITune prend en charge plusieurs frameworks, TensorRT, Torch-TensorRT, TorchAO et Torch Inductor, et les évalue automatiquement sur le matériel cible pour sélectionner le plus performant, sans que le développeur ait à intervenir. Il couvre une large gamme de cas d'usage : vision par ordinateur, traitement du langage naturel, reconnaissance vocale et IA générative. Le résultat de l'optimisation est sérialisé dans un fichier .ait, compilé une seule fois et rechargeable à chaque redéploiement sans temps de chauffe. L'outil répond à un problème concret qui ralentissait les équipes MLOps depuis des années : le fossé entre le modèle entraîné par un chercheur et le modèle réellement efficace en conditions de production. Jusqu'ici, comparer TensorRT, Torch-TensorRT ou TorchAO nécessitait de les configurer et tester séparément, souvent avec du code sur mesure. AITune effondre ce travail en une seule API Python. Il propose deux modes : un mode AOT (ahead-of-time), qui profile tous les backends, valide la correction des sorties et sélectionne le meilleur pour chaque sous-module du modèle ou de la pipeline, et un mode JIT (just-in-time), qui s'active via une variable d'environnement et optimise les modules à la volée sans modifier le code existant. Le mode AOT est le plus puissant : il détecte les axes dynamiques comme la longueur de séquence dans les LLMs, permet de mélanger différents backends dans une même pipeline, et met en cache les artefacts pour éviter de recompiler à chaque redéploiement. Ce lancement s'inscrit dans un effort plus large de NVIDIA pour simplifier le chemin entre la recherche et la production à mesure que la pression sur les coûts d'inférence s'intensifie. Avec la multiplication des modèles déployés à grande échelle, notamment des LLMs et des modèles de vision, le choix du backend d'optimisation est devenu un levier critique de rentabilité. TensorRT existe depuis plus d'une décennie, mais son intégration dans des pipelines PyTorch complexes restait laborieuse. En proposant une abstraction unifiée et automatisée, NVIDIA positionne AITune comme un outil de référence pour les équipes d'ingénierie ML, potentiellement en concurrence directe avec des solutions propriétaires ou des pipelines maison. La disponibilité en open source sous Apache 2.0 devrait favoriser une adoption rapide, notamment dans les entreprises qui cherchent à optimiser leurs coûts GPU sans investir dans des équipes spécialisées en compilation de modèles.

UELes équipes MLOps européennes peuvent adopter immédiatement cet outil open source via PyPI pour réduire leurs coûts d'inférence GPU en production, sans dépendance à des solutions propriétaires.

OutilsOutil
1 source
Guide de code complet sur NVIDIA KVPress : inférence LLM à contexte long et compression du cache KV
163MarkTechPost 

Guide de code complet sur NVIDIA KVPress : inférence LLM à contexte long et compression du cache KV

NVIDIA a publié KVPress, une bibliothèque open source conçue pour compresser le cache clé-valeur (KV cache) des grands modèles de langage et réduire drastiquement leur consommation mémoire lors des inférences sur de longs contextes. Un tutoriel complet publié récemment par des ingénieurs en IA illustre son fonctionnement concret à travers une implémentation pas-à-pas exécutable sur Google Colab. L'exemple s'appuie sur le modèle Qwen2.5-1.5B-Instruct de Qwen, chargé en quantification 4 bits via la bibliothèque BitsAndBytes, et fait appel à la version 0.4.0 de KVPress. Deux stratégies de compression sont comparées : ExpectedAttentionPress, qui estime l'importance des tokens en fonction de l'attention attendue, et KnormPress, qui s'appuie sur la norme des vecteurs K pour éliminer les entrées peu pertinentes. Le pipeline génère un corpus synthétique long, pose des questions ciblées sur ce corpus, puis mesure les écarts de performance et d'empreinte mémoire entre la génération standard et les différentes configurations compressées. L'enjeu est considérable pour l'industrie du traitement du langage naturel. Le KV cache est le principal goulot d'étranglement mémoire lors de l'inférence sur de longs contextes : chaque token généré alimente un cache qui grossit linéairement, rendant les fenêtres de 32 000, 128 000 voire un million de tokens extrêmement coûteuses en VRAM. KVPress permet de ne conserver dans ce cache que les entrées jugées les plus informatives, en supprimant dynamiquement les tokens à faible contribution. Pour les développeurs déployant des applications d'analyse de documents, de recherche d'information ou d'agents conversationnels à mémoire longue, cette compression peut rendre viables des scénarios qui nécessiteraient sinon du matériel de classe A100 ou H100. La possibilité de faire tourner ces expériences sur Colab, avec une simple GPU grand public, illustre bien la baisse de barrière à l'entrée que KVPress ambitionne d'offrir. La gestion du KV cache est devenue l'un des fronts les plus actifs de la recherche en inférence LLM depuis que les fenêtres contextuelles ont explosé en 2023-2024. Des techniques comme Sliding Window Attention, PagedAttention (à la base de vLLM) ou les approches de quantification du cache ont émergé pour répondre à cette pression. NVIDIA, en proposant KVPress comme couche d'abstraction modulaire compatible avec le pipeline Hugging Face Transformers, cherche à standardiser l'accès à ces optimisations pour un public plus large que les seules équipes d'infrastructure. La prochaine étape naturelle sera d'évaluer ces stratégies sur des modèles de plus grande taille et sur des benchmarks de rétention d'information à longue portée, pour quantifier précisément le compromis entre taux de compression et fidélité des réponses dans des cas d'usage de production.

OutilsTuto
1 source
Guide pratique : utiliser le Transformer Engine NVIDIA avec précision mixte, vérifications FP8 et exécution de secours
164MarkTechPost 

Guide pratique : utiliser le Transformer Engine NVIDIA avec précision mixte, vérifications FP8 et exécution de secours

Le Transformer Engine de NVIDIA s'impose progressivement comme un outil de référence pour accélérer l'entraînement des modèles de deep learning en entreprise. Un tutoriel technique publié récemment propose une implémentation complète en Python, couvrant l'installation des composants, la vérification de la compatibilité GPU et CUDA, ainsi que la comparaison directe entre un pipeline PyTorch standard et un pipeline optimisé via le Transformer Engine. La démonstration construit deux réseaux neuronaux (enseignant et élève), les entraîne en parallèle, mesure leurs performances respectives en termes de vitesse d'exécution et de consommation mémoire, et produit des visualisations comparatives. Le tutoriel prend soin de gérer les échecs d'installation silencieusement, de manière à ce que le notebook reste exécutable même lorsque l'extension native ne peut pas être compilée, via un mode de repli automatique. Ce type d'outillage répond à un besoin concret des équipes d'IA cherchant à réduire les coûts d'entraînement sans changer d'architecture. Le Transformer Engine exploite la précision FP8 (8 bits flottants), disponible sur les GPU NVIDIA à partir de l'architecture Hopper (H100), pour effectuer les calculs matriciels les plus lourds avec une empreinte mémoire réduite et un débit augmenté, tout en maintenant la précision finale du modèle grâce à la gestion automatique des facteurs d'échelle. En pratique, cela peut se traduire par des gains de vitesse significatifs sur les passes avant et arrière des transformers, réduisant directement le temps et le coût des runs d'entraînement à grande échelle. L'approche intéresse aussi bien les laboratoires de recherche que les équipes MLOps en production. NVIDIA a développé le Transformer Engine en réponse à la montée en puissance des modèles de langage et de vision nécessitant des milliards de paramètres, pour lesquels la précision FP32 ou même FP16 devient un goulot d'étranglement. Introduit officiellement avec les GPU H100 et le framework TransformerEngine open source, il s'intègre à PyTorch et JAX via des couches drop-in comme te.Linear et te.TransformerLayer. La complexité d'installation, notamment la nécessité d'un compilateur NVCC et des headers cuDNN présents sur la machine, freine encore son adoption hors des environnements cloud spécialisés. Le tutoriel aborde précisément ce point de friction en proposant une détection automatique de l'environnement et un fallback propre, ce qui devrait abaisser la barrière d'entrée pour les équipes souhaitant expérimenter avant de migrer leurs pipelines de production vers cette technologie.

InfrastructureTuto
1 source
Guide pas à pas : pipeline d'optimisation de modèles avec NVIDIA Model Optimizer, élagage FastNAS et affinage
165MarkTechPost 

Guide pas à pas : pipeline d'optimisation de modèles avec NVIDIA Model Optimizer, élagage FastNAS et affinage

NVIDIA a publié un tutoriel complet détaillant comment construire un pipeline d'optimisation de bout en bout à l'aide de son outil NVIDIA Model Optimizer, combinant entraînement, élagage (pruning) et ajustement fin (fine-tuning) d'un réseau de neurones profond, le tout dans Google Colab sans infrastructure dédiée. Le pipeline repose sur l'architecture ResNet appliquée au jeu de données CIFAR-10, et utilise la technique FastNAS pour réduire la complexité computationnelle du modèle sous une contrainte de 60 millions de FLOPs (opérations en virgule flottante). Concrètement, le modèle est d'abord entraîné sur 12 000 exemples pendant 20 époques pour établir une référence, puis soumis à l'élagage structurel FastNAS qui supprime systématiquement les couches et filtres les moins utiles, avant une phase de fine-tuning de 12 époques pour récupérer la précision perdue. Cette approche répond à un besoin pressant dans l'industrie : déployer des modèles d'IA performants sur des matériels contraints, comme les appareils embarqués, les téléphones mobiles ou les serveurs à faible consommation. En réduisant le nombre de FLOPs sans sacrifier significativement la précision, FastNAS permet de rendre un modèle jusqu'à plusieurs fois plus léger et plus rapide à l'inférence. Pour les équipes ML en entreprise, cela se traduit par des coûts de déploiement réduits, une latence moindre et une empreinte énergétique plus faible. Le fait que l'ensemble du pipeline soit reproductible dans Colab, avec gestion des seeds et des sous-ensembles de données, le rend accessible à des équipes sans cluster GPU dédié. NVIDIA développe Model Optimizer dans le cadre de sa stratégie plus large pour contrôler toute la chaîne de valeur de l'IA, de l'entraînement jusqu'au déploiement sur ses propres puces. FastNAS s'inscrit dans une famille de techniques de compression de modèles qui inclut également la quantification et la distillation, toutes intégrées dans l'écosystème NVIDIA TensorRT. Face à la montée en puissance des outils open source comme la bibliothèque PEFT de Hugging Face ou les approches de pruning de PyTorch, NVIDIA positionne Model Optimizer comme une solution intégrée et orientée production. La prochaine étape logique de ce pipeline serait la conversion du modèle élaguévers le format ONNX ou TensorRT pour un déploiement sur GPU NVIDIA, bouclant ainsi la boucle entre recherche et mise en production industrielle.

OutilsTuto
1 source
L'efficacité à grande échelle : NVIDIA et les acteurs de l'énergie accélèrent les centres d'IA flexibles pour renforcer le réseau électrique
166NVIDIA AI Blog 

L'efficacité à grande échelle : NVIDIA et les acteurs de l'énergie accélèrent les centres d'IA flexibles pour renforcer le réseau électrique

NVIDIA et la startup Emerald AI ont présenté lors du CERAWeek — le sommet mondial de l'énergie surnommé le « Davos de l'énergie » — une architecture inédite qui transforme les usines à IA en actifs flexibles pour le réseau électrique. Construite sur la plateforme NVIDIA Vera Rubin DSX et le logiciel Conductor d'Emerald AI, cette approche intègre calcul, gestion de l'énergie et pilotage en temps réel dans une architecture unifiée. Concrètement, une usine à IA peut désormais moduler sa consommation électrique en fonction des conditions du réseau, tout en continuant à produire des tokens. Six grands acteurs de l'énergie — AES, Constellation, Invenergy, NextEra Energy, Nscale Energy & Power et Vistra — se sont engagés à construire des capacités de production compatibles avec cette architecture, notamment via des projets hybrides combinant alimentation locale et connexion au réseau. Du côté de l'efficacité pure, NVIDIA revendique une progression d'un million de fois le nombre de tokens générés pour un même budget énergétique, entre le GPU Kepler de 2012 et la plateforme Vera Rubin lancée cette année. La métrique clé est désormais le « tokens par seconde par watt ». Cet enjeu dépasse la simple optimisation technique : la croissance explosive des infrastructures IA menace de déstabiliser des réseaux électriques déjà sous tension. En rendant les centres de calcul capables de s'adapter en temps réel à l'offre disponible — en réduisant leur consommation lors des pics de demande, par exemple — cette approche évite de dimensionner le réseau pour des pointes qui ne surviennent que rarement. Pour les opérateurs d'énergie, cela représente une nouvelle classe de clients industriels qui, au lieu de fragiliser le réseau, peuvent contribuer à sa stabilité. Pour les entreprises qui déploient l'IA à grande échelle, l'avantage est double : des coûts opérationnels réduits et un accès accéléré à la puissance électrique, souvent le principal goulot d'étranglement dans la construction de nouveaux data centers. Jensen Huang, fondateur et PDG de NVIDIA, décrit l'infrastructure IA comme un « gâteau à cinq couches » — énergie, puces, infrastructure, modèles, applications — dans lequel l'énergie constitue la base fondatrice. C'est dans cette logique que s'inscrit également l'annonce de Maximo, une entreprise de robotique solaire incubée par AES, qui a achevé l'installation autonome d'une ferme solaire de 100 mégawatts sur le site Bellefield d'AES, en utilisant NVIDIA Omniverse et Isaac Sim. TerraPower, en partenariat avec SoftServe, a de son côté présenté une plateforme de jumeau numérique propulsée par Omniverse pour accélérer la conception de réacteurs nucléaires. Ces annonces illustrent une tendance de fond : l'IA ne se contente plus de consommer de l'énergie, elle commence à en accélérer la production.

UENscale, opérateur européen de data centers, figure parmi les six partenaires engagés dans cette architecture, ce qui pourrait influencer la stratégie énergétique des centres de calcul IA en Europe.

InfrastructureActu
1 source
« L’AGI est déjà là » : la phrase choc de NVIDIA qui fait l’effet d’un séisme
167Le Big Data 

« L’AGI est déjà là » : la phrase choc de NVIDIA qui fait l’effet d’un séisme

Lors d'un entretien avec Lex Fridman, Jensen Huang (PDG de Nvidia) a déclaré que « l'AGI est déjà là », en adoptant une définition purement économique : une IA capable de générer un milliard de dollars de valeur de manière autonome (influenceur virtuel viral, application à 50 centimes touchant des milliards d'utilisateurs). Cette vision ultra-capitaliste rompt avec le consensus scientifique — Yann LeCun (Meta) rappelle que les modèles actuels n'atteignent pas même l'intelligence d'un chat — mais Huang contourne le débat philosophique pour imposer un critère de performance économique comme nouvelle définition de l'AGI.

LLMsOpinion
1 source
NVIDIA fait don d'un pilote d'allocation dynamique de ressources GPU à la communauté Kubernetes pour faire avancer l'IA open source
168NVIDIA AI Blog 

NVIDIA fait don d'un pilote d'allocation dynamique de ressources GPU à la communauté Kubernetes pour faire avancer l'IA open source

NVIDIA a annoncé lors du KubeCon Europe à Amsterdam le don de son pilote Dynamic Resource Allocation (DRA) pour GPU à la Cloud Native Computing Foundation (CNCF), transférant ainsi la gouvernance du logiciel à la communauté Kubernetes. Ce pilote permet un partage intelligent des ressources GPU, supporte les technologies Multi-Instance GPU et Multi-Node NVLink, et facilite l'entraînement de modèles massifs sur les systèmes Grace Blackwell. NVIDIA introduit également le support GPU pour Kata Containers en collaboration avec la communauté CNCF Confidential Containers, renforçant l'isolation et la sécurité des charges de travail IA.

UEAnnoncé à KubeCon Europe à Amsterdam, ce don à la CNCF bénéficie directement aux équipes cloud européennes qui déploient des charges de travail IA sur Kubernetes avec des GPU.

OutilsActu
1 source
Nvidia : Jensen Huang déclare avoir atteint l'AGI
169The Verge AI 

Nvidia : Jensen Huang déclare avoir atteint l'AGI

Le PDG de Nvidia, Jensen Huang, a déclaré sur le podcast de Lex Fridman : "Je pense que nous avons atteint l'AGI." Cette affirmation relance le débat autour de l'intelligence artificielle générale (AGI), un terme désignant une IA égale ou supérieure à l'intelligence humaine. Alors que certains dirigeants tech tentent de remplacer ce terme jugé trop vague, Huang l'utilise ouvertement, soulignant que les systèmes actuels réussissent des tests qui, il y a cinq ans, auraient été considérés comme la définition même de l'AGI.

LLMsActu
1 source
Comment les agents IA autonomes deviennent sécurisés par conception grâce à NVIDIA OpenShell
170NVIDIA AI Blog 

Comment les agents IA autonomes deviennent sécurisés par conception grâce à NVIDIA OpenShell

NVIDIA lance OpenShell, un runtime open source intégré à l'NVIDIA Agent Toolkit, conçu pour exécuter des agents autonomes dans des sandboxes isolées avec des politiques de sécurité appliquées au niveau système — hors de portée des agents eux-mêmes. Cette architecture empêche les agents de contourner les contraintes, de fuiter des identifiants ou des données sensibles, même en cas de compromission. NVIDIA collabore avec Cisco, CrowdStrike, Google Cloud, Microsoft Security et TrendAI pour aligner la gestion des politiques runtime à l'échelle des entreprises, tandis que NemoClaw fournit une stack de référence open source combinant OpenShell et les modèles Nemotron pour déployer des assistants IA personnels auto-évolutifs.

OutilsActu
1 source
L'NVIDIA RTX PRO 6000 Blackwell Workstation Edition transforme la data science
171IEEE Spectrum AI 

L'NVIDIA RTX PRO 6000 Blackwell Workstation Edition transforme la data science

La NVIDIA RTX PRO 6000 Blackwell Workstation Edition, commercialisée par PNY Technologies, est présentée comme la GPU de bureau la plus puissante jamais construite, conçue pour répondre aux besoins croissants des data scientists face à des volumes de données massifs. Elle supporte jusqu'à quatre GPU en configuration multi-carte pour atteindre des performances équivalentes aux data centers, avec une intégration native dans l'écosystème logiciel NVIDIA (CUDA-X, plus de 100 applications IA). En maintenant les données en local plutôt que dans le cloud, elle offre également un avantage en matière de sécurité et de maîtrise des coûts pour les entreprises.

OutilsActu
1 source
DLSS 5 : date de sortie, cartes compatibles, rendu neuronal… Tout savoir sur la technologie de Nvidia
172Frandroid 

DLSS 5 : date de sortie, cartes compatibles, rendu neuronal… Tout savoir sur la technologie de Nvidia

Nvidia a dévoilé le DLSS 5 lors de la conférence GTC, une nouvelle itération de sa technologie d'upscaling basée sur le rendu neuronal. La présentation répond aux nombreuses critiques récentes entourant cette technologie, en détaillant les cartes graphiques compatibles et la date de sortie prévue.

OutilsOutil
1 source
Le directeur de la robotique de Nvidia : les agents IA vont provoquer un moment ChatGPT pour la robotique
173The Information AI 

Le directeur de la robotique de Nvidia : les agents IA vont provoquer un moment ChatGPT pour la robotique

Deepu Talla, vice-président de la robotique chez Nvidia, affirme que les agents IA représenteront pour la robotique ce que ChatGPT a été pour l'IA grand public. Un seul agent pourrait coordonner toute une flotte de robots, décomposant un objectif en tâches spécifiques assignées à chaque robot. Nvidia mise sur l'extension de ses systèmes d'IA agentique, d'abord conçus pour le numérique, vers des modèles physiques présentés lors de la conférence GTC à San José.

RobotiqueActu
1 source
174Frandroid 

Nvidia DLSS : avantages, fonctionnement, performances… Quand l’IA vient au secours de vos jeux

Le DLSS (Deep Learning Super Sampling) de Nvidia est une technologie d'upscaling basée sur l'IA qui améliore significativement les performances dans les jeux vidéo. L'article explique son fonctionnement, ses réglages et le compare aux solutions concurrentes d'AMD et d'Intel. Il s'adresse aux joueurs souhaitant optimiser leur expérience graphique grâce à l'intelligence artificielle.

OutilsOutil
1 source
L'atelier Build-A-Claw de Nvidia
175The Information AI 

L'atelier Build-A-Claw de Nvidia

Lors de la conférence GTC de Nvidia, l'attraction phare était le stand "Build-A-Claw", où les participants pouvaient tester NemoClaw, un logiciel open-source pour créer des agents IA basé sur OpenClaw. NemoClaw introduit des contrôles de confidentialité et de sécurité qui faisaient défaut à OpenClaw, permettant aux utilisateurs de restreindre les fichiers accessibles et les actions réalisables par un agent. Ces nouvelles garanties visent particulièrement les entreprises soucieuses des risques de sécurité liés aux agents IA.

OutilsOutil
1 source
Space-1 Vera Rubin : pourquoi Nvidia déploie ses GPU dans l’espace (et comment ils y survivent)
176Frandroid 

Space-1 Vera Rubin : pourquoi Nvidia déploie ses GPU dans l’espace (et comment ils y survivent)

Nvidia déploie ses GPU dans l'espace avec le projet Space-1, basé sur l'architecture Vera Rubin, offrant jusqu'à 50 pétaflops de puissance de calcul. Ces puces ont été spécialement durcies pour fonctionner en orbite sans air ni refroidissement classique. L'objectif est de transformer les satellites en mini centres de données IA directement en orbite, réduisant la latence liée aux allers-retours avec le sol.

InfrastructureOpinion
1 source
NVIDIA AI publie 'OpenShell' en open source : un environnement d'exécution sécurisé pour les agents IA autonomes
177MarkTechPost 

NVIDIA AI publie 'OpenShell' en open source : un environnement d'exécution sécurisé pour les agents IA autonomes

NVIDIA a mis en open source OpenShell, un environnement d'exécution sécurisé conçu pour les agents IA autonomes, publié sous licence Apache 2.0. Il offre un sandboxing au niveau noyau, un moteur de politiques granulaires (contrôle par binaire, endpoint et méthode API) avec journalisation complète, ainsi qu'un routage d'inférence privé pour éviter les fuites de données. OpenShell est agnostique aux frameworks — compatible avec Claude Code, Codex, LangChain et autres — et s'intègre comme une couche de sécurité sans réécriture du code agent.

UEOpenShell peut être adopté par les développeurs et entreprises européens pour sécuriser leurs agents IA autonomes, en répondant aux exigences de traçabilité et de contrôle imposées par l'AI Act européen.

OutilsOutil
1 source
Nvidia reprend la fabrication pour les ventes du H200 en Chine, selon son PDG
178The Information AI 

Nvidia reprend la fabrication pour les ventes du H200 en Chine, selon son PDG

Nvidia relance la production de ses puces H200 destinées au marché chinois, selon son PDG Jensen Huang. L'entreprise a déjà reçu des commandes de clients chinois, ce qui implique un feu vert du gouvernement chinois pour ces achats.

UELa reprise des exportations de puces Nvidia vers la Chine pourrait réduire la pression sur l'approvisionnement mondial en GPU, bénéficiant indirectement aux entreprises européennes du secteur IA.

BusinessActu
1 source
NVIDIA et les géants des télécoms construisent des grilles IA pour optimiser l'inférence sur les réseaux distribués
179NVIDIA AI Blog 

NVIDIA et les géants des télécoms construisent des grilles IA pour optimiser l'inférence sur les réseaux distribués

À la conférence NVIDIA GTC 2026, les grands opérateurs télécom américains et asiatiques (AT&T, Comcast et d'autres) ont annoncé la création d'AI grids — des infrastructures IA géographiquement distribuées exploitant leurs réseaux existants pour rapprocher l'inférence IA des utilisateurs. Les télécoms disposent de quelque 100 000 datacenters distribués dans le monde, représentant un potentiel de plus de 100 gigawatts de capacité IA. AT&T s'associe à Cisco et NVIDIA pour des cas d'usage IoT en temps réel, tandis que Comcast développe un AI grid orienté expériences hyper-personnalisées avec NVIDIA, HPE, Decart et Personal AI.

UELes opérateurs télécom européens pourraient être incités à développer des infrastructures distribuées similaires pour rester compétitifs, mais aucun acteur européen n'est impliqué dans ces annonces.

InfrastructureActu
1 source
GeForce RTX : avec DLSS 5 et son rendu photoréaliste, l’IA de NVIDIA va-t-elle trop loin ?
180Next INpact 

GeForce RTX : avec DLSS 5 et son rendu photoréaliste, l’IA de NVIDIA va-t-elle trop loin ?

NVIDIA annonce DLSS 4.5 avec le Dynamic Multi Frame Generation et un mode 6x (disponible le 31 mars pour les RTX série 50), permettant d'atteindre 240 fps à partir de seulement 40 fps GPU réels. DLSS 5, prévu pour l'automne 2026, promet un rendu photoréaliste dans les jeux, mais suscite une réception mitigée, certains l'accusant d'« AI Slop ». Côté matériel, NVIDIA concentre ses annonces GTC sur les datacenters avec l'architecture Vera Rubin, sans nouvelles GeForce RTX grand public.

OutilsOutil
1 source
Nvidia invente le filtre de beauté Instagram pour les jeux vidéo : les joueurs détestent
18101net 

Nvidia invente le filtre de beauté Instagram pour les jeux vidéo : les joueurs détestent

Nvidia a présenté le DLSS 5, sa nouvelle technologie d'upscaling pour jeux vidéo utilisant une IA particulièrement agressive. La fonctionnalité transforme profondément les graphismes des jeux, ce qui provoque une vive polémique dans la communauté des joueurs. Ces derniers craignent que leurs jeux soient dénaturés par ce traitement IA, comparé à un mauvais filtre Instagram.

OutilsOutil
1 source
OpenClaw séduit massivement, Nvidia veut désormais le rendre plus sûr
182Siècle Digital 

OpenClaw séduit massivement, Nvidia veut désormais le rendre plus sûr

Nvidia, lors de la conférence GTC 2026 avec Jensen Huang, s'est positionné sur la sécurité des agents IA autonomes en s'appuyant sur OpenClaw. Face à l'essor de ces outils capables d'agir seuls sur un ordinateur, la sécurité reste un défi majeur. Nvidia entend structurer l'avenir de l'IA personnelle autour de ce framework tout en renforçant ses garanties de sûreté.

UEL'adoption d'OpenClaw comme standard pour les agents IA autonomes pourrait influencer les exigences de conformité à l'AI Act européen concernant les systèmes à haut risque.

OutilsActu
1 source
SSD PCIe 6.0, HBM4 et SOCAMM2 : Micron fait « all-in » sur NVIDIA et l’IA
183Next INpact 

SSD PCIe 6.0, HBM4 et SOCAMM2 : Micron fait « all-in » sur NVIDIA et l’IA

À la GTC 2026 de NVIDIA, Micron annonce plusieurs produits datacenter centrés sur l'IA : la HBM4 36 Go (12 couches) est en production de masse avec 2,8 To/s de bande passante, soit 2,3x la HBM3E, et des modules 48 Go (16 couches) sont en phase de qualification. Micron annonce également des modules mémoire SOCAMM2 conçus spécifiquement pour les systèmes NVIDIA Vera Rubin NVL72, rejoignant SK Hynix sur ce segment. Samsung en parallèle présente sa HBM4E (7e génération) atteignant 4 To/s, tandis que Micron prépare sa propre HBM4E 64 Go pour 2027.

OutilsActu
1 source
Comment NTT DATA et NVIDIA accélèrent le déploiement de l’IA en entreprise
184Le Big Data 

Comment NTT DATA et NVIDIA accélèrent le déploiement de l’IA en entreprise

NTT DATA et NVIDIA s'associent pour lancer des "usines d'IA" — des plateformes entreprise combinant les GPU NVIDIA avec les logiciels NeMo (création de systèmes multi-agents) et NIM (microservices conteneurisés) pour industrialiser le déploiement de l'IA. L'objectif est de réduire la complexité technique et le temps nécessaire pour passer d'un prototype à une solution opérationnelle, grâce à des prototypes GenAI pré-qualifiés et une gouvernance intégrée. Des cas d'usage concrets existent déjà, notamment dans le médical (analyses radiologiques pour un centre de recherche oncologique) et l'automobile (validation de charges de travail IA chez un équipementier mondial).

UENTT DATA dispose d'une présence significative en Europe, rendant cette offre d'usines IA directement accessible aux DSI européens cherchant à industrialiser leurs déploiements GenAI.

BusinessActu
1 source
Nvidia lance le DLSS 5 : impressionnant, mais déjà sujet aux polémiques
185Numerama 

Nvidia lance le DLSS 5 : impressionnant, mais déjà sujet aux polémiques

Nvidia a dévoilé le DLSS 5, la nouvelle génération de sa technologie d'upscaling par IA. Bien que visuellement impressionnant, il suscite déjà des controverses en raison d'un rendu qui peut altérer l'image originale, notamment au niveau des visages.

OutilsOutil
1 source
Avec DLSS 5, l’IA de Nvidia fabrique désormais les images des jeux vidéo
18601net 

Avec DLSS 5, l’IA de Nvidia fabrique désormais les images des jeux vidéo

Avec DLSS 5, Nvidia introduit une avancée majeure dans les technologies d'upscaling pour jeux vidéo. L'IA de Nvidia passe désormais à créer directement les images de rendu graphique, au lieu de simplement les reconstruire. Cette innovation marque une étape significative dans l'amélioration des performances visuelles des jeux vidéo.

OutilsOutil
1 source
AWS et NVIDIA renforcent leur collaboration stratégique pour accélérer le passage de l'IA du pilote à la production
187AWS ML Blog 

AWS et NVIDIA renforcent leur collaboration stratégique pour accélérer le passage de l'IA du pilote à la production

AWS et NVIDIA ont annoncé lors du GTC 2026 un partenariat élargi incluant le déploiement de plus d'un million de GPU NVIDIA (architectures Blackwell et Rubin) dans les régions cloud AWS dès 2026. AWS devient le premier grand fournisseur cloud à supporter les GPU RTX PRO 4500 Blackwell Server Edition sur Amazon EC2, couvrant des usages variés comme l'IA conversationnelle, l'analytique et le rendu vidéo. La collaboration inclut également une accélération de l'inférence LLM via NVIDIA NIXL sur AWS EFA, des performances Apache Spark 3x plus rapides avec Amazon EMR, et un support étendu des modèles NVIDIA Nemotron sur Amazon Bedrock.

UELes entreprises et développeurs européens utilisant AWS pourront accéder aux nouvelles instances GPU Blackwell pour leurs déploiements IA en production.

BusinessActu
1 source
Roche déploie les usines IA NVIDIA à l'échelle mondiale pour accélérer la découverte de médicaments, les solutions diagnostiques et les avancées en fabrication
188NVIDIA AI Blog 

Roche déploie les usines IA NVIDIA à l'échelle mondiale pour accélérer la découverte de médicaments, les solutions diagnostiques et les avancées en fabrication

Le corps de l'article ne contient pas de contenu réel ("adfafasf"). Je ne peux résumer que le titre : Résumé basé sur le titre uniquement : Roche déploie des infrastructures AI Factories de NVIDIA à l'échelle mondiale pour accélérer la découverte de médicaments, les solutions de diagnostic et les avancées en fabrication. Fournis le contenu complet de l'article pour un résumé précis.

UERoche, entreprise pharmaceutique dont le siège européen est en Suisse, déploie des infrastructures IA à l'échelle mondiale, ce qui pourrait accélérer la R&D médicale et les capacités diagnostiques en Europe.

BusinessActu
1 source
Nvidia lance Data Factory et des modèles robotiques dans son offensive pour l'IA physique
189AI Business 

Nvidia lance Data Factory et des modèles robotiques dans son offensive pour l'IA physique

Nvidia lance Data Factory et de nouveaux modèles de robotique dans le cadre de sa stratégie d'IA physique, visant à renforcer sa position dominante dans ce secteur en pleine expansion. Ces annonces s'inscrivent dans la volonté du géant des puces IA de s'imposer comme acteur incontournable au-delà du seul marché des GPU pour centres de données.

RobotiqueActu
1 source
DLSS 5 : comment Nvidia exploite le rendu neuronal pour métamorphoser vos jeux PC
190Frandroid 

DLSS 5 : comment Nvidia exploite le rendu neuronal pour métamorphoser vos jeux PC

Nvidia a dévoilé en avant-première le DLSS 5, prévu pour un lancement officiel à l'automne prochain. Cette nouvelle version marque une évolution majeure reposant sur le rendu neuronal, une approche qui promet de transformer fondamentalement la qualité graphique des jeux PC. Le DLSS 5 représente un changement technique profond par rapport aux versions précédentes dans la manière dont les images sont générées et upscalées.

OutilsActu
1 source
NVIDIA DSX Air accélère le temps de génération des tokens grâce à la simulation pour les usines d'IA
191NVIDIA AI Blog 

NVIDIA DSX Air accélère le temps de génération des tokens grâce à la simulation pour les usines d'IA

NVIDIA a lancé DSX Air lors du GTC 2026 à San Jose, présenté par Jensen Huang : une plateforme SaaS de simulation d'usines IA qui crée des jumeaux numériques haute-fidélité de l'infrastructure NVIDIA (GPU, SuperNICs, DPU, switches) avant même la livraison du matériel. Des entreprises comme CoreWeave l'utilisent déjà pour valider leurs environnements en simulation, réduisant le délai de mise en service de plusieurs semaines ou mois à quelques jours voire quelques heures. La plateforme réunit l'ensemble de l'écosystème — fabricants de serveurs, orchestration, stockage, sécurité — dans un environnement de test unifié via des API ouvertes.

OutilsActu
1 source
La prochaine puce de Nvidia serait vraiment différente des autres
192Frandroid 

La prochaine puce de Nvidia serait vraiment différente des autres

Nvidia envisagerait de rompre avec son approche "tout-en-un" habituelle pour ses GPU, en développant une puce d'architecture fondamentalement différente. Cette évolution stratégique marquerait un tournant majeur pour le leader des puces IA. L'article ne précise pas le nom ni les caractéristiques techniques de cette future puce.

InfrastructureOpinion
1 source
Tout savoir sur NemoClaw, le futur concurrent d’OpenClaw signé Nvidia
193Frandroid 

Tout savoir sur NemoClaw, le futur concurrent d’OpenClaw signé Nvidia

Nvidia lance NemoClaw, son propre clone d'OpenClaw, après que Jensen Huang avait qualifié OpenClaw de logiciel « le plus important de l'histoire ». Le PDG de Nvidia confirme ainsi l'entrée directe de la firme en concurrence frontale avec OpenClaw. Aucun détail technique supplémentaire n'est disponible dans l'article.

LLMsActu
1 source
NVIDIA lance Nemotron 3 Super : un modèle open source hybride Mamba-Attention MoE de 120 milliards de paramètres offrant un débit 5 fois supérieur pour l'IA agentique
194MarkTechPost 

NVIDIA lance Nemotron 3 Super : un modèle open source hybride Mamba-Attention MoE de 120 milliards de paramètres offrant un débit 5 fois supérieur pour l'IA agentique

NVIDIA lance Nemotron 3 Super, un modèle open-source de 120 milliards de paramètres combinant architecture hybride Mamba-Attention et Mixture of Experts (MoE), conçu spécifiquement pour les applications multi-agents complexes. Il offre jusqu'à 7x plus de débit et une précision doublée par rapport à la génération précédente, grâce à cinq innovations clés dont la prédiction multi-tokens, une fenêtre de contexte d'un million de tokens et l'intégration de NeMo RL Gym. Ce modèle se positionne entre le Nemotron 3 Nano (30B paramètres) et l'Ultra (500B), attendu plus tard en 2026.

LLMsOutil
1 source
NVIDIA AI dévoile Nemotron-Terminal : un pipeline systématique d'ingénierie des données pour le passage à l'échelle des agents LLM en terminal
195MarkTechPost 

NVIDIA AI dévoile Nemotron-Terminal : un pipeline systématique d'ingénierie des données pour le passage à l'échelle des agents LLM en terminal

NVIDIA dévoile Nemotron-Terminal, un framework complet pour entraîner des agents IA autonomes en ligne de commande, incluant le pipeline Terminal-Task-Gen et le dataset Terminal-Corpus. La solution adopte une approche "coarse-to-fine" : adaptation de datasets existants (163 000 prompts mathématiques, 35 000 prompts code, 32 000 prompts SWE) combinée à une génération synthétique de tâches basée sur une taxonomie de compétences terminal couvrant 9 domaines (sécurité, data science, administration système, etc.). Ce framework vise à résoudre le manque criant de données d'entraînement pour les agents terminal, un problème qui freinait jusqu'ici des projets comme Claude Code ou Codex CLI.

OutilsPaper
1 source
NVIDIA donne vie à des agents avec DGX Spark et Reachy Mini
196HuggingFace Blog 

NVIDIA donne vie à des agents avec DGX Spark et Reachy Mini

NVIDIA introduit DGX Spark, une plateforme AI miniature, et Reachy Mini, un bras robotique. DGX Spark est conçu pour les développeurs, offrant une puissance de calcul pour des applications AI locales. Reachy Mini est un bras robotique collaboratif, plus petit et plus abordable, destiné aux démonstrations et à l'apprentissage. Résumé: NVIDIA lance DGX Spark, une plateforme AI compacte pour développeurs, et Reachy Mini, un bras robotique collaboratif plus petit et accessible.

UENVIDIA's DGX Spark et Reachy Mini pourraient propulser les startups et PME françaises dans l'IA et la robotique, en fournissant des outils de calcul accessibles et des bras robotiques collaboratifs, tout en respectant les futures exigences de l'AI Act et en offrant des opportunités dans divers secteurs.

RobotiqueOutil
1 source
Le Standard d'Évaluation Ouverte : Évaluation de NVIDIA Nemotron 3 Nano avec NeMo Evaluator
197HuggingFace Blog 

Le Standard d'Évaluation Ouverte : Évaluation de NVIDIA Nemotron 3 Nano avec NeMo Evaluator

Le Standard d'Évaluation Ouverte : Comparaison de NVIDIA Nemotron 3 Nano avec NeMo Evaluator Ce texte présente l'utilisation du NeMo Evaluator pour tester les performances du NVIDIA Nemotron 3 Nano, un modèle de processeur AI, en se basant sur le Standard d'Évaluation Ouverte. Les résultats mettent en évidence des améliorations significatives en termes de vitesse et d'efficacité énergétique par rapport aux versions précédentes.

UELe NeMo Evaluator a évalué le NVIDIA Nemotron 3 Nano, un processeur AI, selon le Standard d'Évaluation Ouverte, révélant des améliorations notables en vitesse et en efficacité énergétique, bénéfique pour les entreprises européennes comme NVIDIA, et aligné avec les objectifs de l'AI Act sur l'efficacité énergétique, tout en respectant le RGPD dans la gestion des données.

RechercheOutil
1 source
Construire un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac
198HuggingFace Blog 

Construire un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac

Titre: Construction d'un robot de santé à partir de simulation jusqu'à déploiement avec NVIDIA Isaac Résumé: NVIDIA Isaac aide à construire un robot médical, passant par la simulation et le déploiement réel, en utilisant des technologies de réalité augmentée et de traitement d'images pour améliorer les soins aux patients.

UENVIDIA Isaac facilite la création de robots médicaux en France, intégrant la réalité augmentée et l'analyse d'images, en respectant les réglementations telles que le RGPD, pour améliorer les soins de santé.

RobotiqueOutil
1 source
Comment concevoir un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac pour le secteur de la santé
199HuggingFace Blog 

Comment concevoir un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac pour le secteur de la santé

Cet article détaille la construction d'un robot de santé à l'aide de NVIDIA Isaac for Healthcare, passant de la simulation à la mise en production. Il met en avant l'utilisation de la plateforme NVIDIA Isaac pour simuler, entraîner et déployer un robot dans un environnement de soins de santé. Les chiffres clés incluent une réduction de 90% du temps de développement grâce à la simulation et des améliorations significatives dans la précision et l'efficacité des tâches robotiques.

UEUtilisation de NVIDIA Isaac for Healthcare pour construire des robots de santé, réduisant le temps de développement de 90% via simulation, impactant le secteur de la santé en France et en Europe, en améliorant la précision et l'efficacité des tâches robotiques, conforme potentiellement aux exigences de l'AI Act et RGPD.

RobotiqueOutil
1 source
Accélérez un monde de grands modèles linguistiques sur Hugging Face avec NVIDIA NIM
200HuggingFace Blog 

Accélérez un monde de grands modèles linguistiques sur Hugging Face avec NVIDIA NIM

NVIDIA a présenté NIM (NVIDIA Image MaKer), un outil permettant d'accélérer le déploiement de grands modèles de langage (LLMs) sur la plateforme Hugging Face. NIM facilite la conversion de modèles de vision par ordinateur en modèles de traitement du langage naturel, simplifiant ainsi l'intégration des LLMs dans les applications. Cette collaboration entre NVIDIA et Hugging Face vise à démocratiser l'accès aux LLMs puissants pour les développeurs et les chercheurs.

UENVIDIA NIM facilite l'intégration des grands modèles de langage par les entreprises françaises et européennes, conformément au RGPD, en accélérant le déploiement sur la plateforme Hugging Face, ainsi que la conversion de modèles de vision par ordinateur en traitement du langage naturel.

OutilsOutil
1 source