Aller au contenu principal
Red Hat et NVIDIA dévoilent une nouvelle infrastructure dédiée aux agents IA
InfrastructureLe Big Data3h

Red Hat et NVIDIA dévoilent une nouvelle infrastructure dédiée aux agents IA

Résumé IASource uniqueImpact UE
Source originale ↗·

Red Hat et NVIDIA ont annoncé le 8 juin 2026, à l'occasion du Red Hat Summit 2026, une série d'évolutions majeures de leur plateforme conjointe Red Hat AI Factory. L'objectif affiché est de permettre aux entreprises de faire passer leurs agents IA autonomes du stade expérimental à la production à grande échelle. Parmi les nouveautés figurent l'intégration d'OpenShell, un projet open source initié par NVIDIA qui fournit un environnement d'exécution isolé pour agents autonomes, ainsi qu'un nouveau modèle MaaS (Model as a Service) gouverné offrant un accès à des modèles comme NVIDIA Nemotron via des interfaces compatibles avec les standards OpenAI. La plateforme embarque également un système de gestion du cycle de vie fondé sur MLflow, qui trace chaque appel aux modèles, les outils sollicités et les étapes de raisonnement des agents. En matière de sécurité, des capacités de calcul confidentiel basées sur NVIDIA Confidential Computing permettent désormais d'exécuter des conteneurs confidentiels au sein de Red Hat OpenShift, disponibles en préversion technologique.

Cette annonce s'adresse directement aux entreprises qui butent sur les obstacles concrets à l'adoption industrielle de l'IA agentique : sécurité des données, auditabilité des décisions, conformité réglementaire. Contrairement aux assistants conversationnels classiques, les agents autonomes interagissent avec de multiples systèmes, exécutent des tâches complexes sur la durée et prennent des décisions sans intervention humaine permanente, ce qui exige un cadre de gouvernance nettement plus robuste. La traçabilité offerte par MLflow répond à une demande pressante des directions juridiques et de conformité, qui doivent justifier les actions automatisées de leurs systèmes IA. L'architecture zero-trust et le calcul confidentiel visent quant à eux à protéger les charges de travail sensibles, même dans des environnements cloud hybrides où les données circulent entre infrastructures on-premise et cloud public.

Ce partenariat entre Red Hat et NVIDIA s'inscrit dans une compétition croissante entre les grands acteurs du cloud hybride et des semi-conducteurs pour imposer leurs stacks comme infrastructure standard de l'IA d'entreprise. NVIDIA, dont les GPU dominent l'entraînement des modèles, cherche à étendre son influence vers les couches logicielles de déploiement et de gouvernance, tandis que Red Hat apporte son positionnement historique dans les environnements OpenShift et son crédit auprès des DSI des grandes entreprises. La standardisation de la gouvernance des agents via OpenShell est particulièrement stratégique : celui qui contrôle la couche de politique d'exécution des agents contrôle de fait l'ensemble de l'écosystème applicatif qui s'y connecte. Les prochaines étapes passeront par l'intégration native d'OpenShell à l'écosystème Red Hat, avec une disponibilité générale attendue après la préversion actuelle.

Impact France/UE

Les entreprises européennes soumises à l'AI Act peuvent s'appuyer sur la traçabilité MLflow et le calcul confidentiel pour répondre aux exigences d'auditabilité et de gouvernance des systèmes d'IA à haut risque.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

NVIDIA et Marvell s’unissent pour révolutionner les infrastructures IA
1Le Big Data 

NVIDIA et Marvell s’unissent pour révolutionner les infrastructures IA

NVIDIA et Marvell Technology ont annoncé un partenariat stratégique majeur, scellé par un investissement de 2 milliards de dollars de NVIDIA dans Marvell. L'accord s'articule autour de NVLink Fusion, une plateforme modulaire permettant de construire des infrastructures d'IA semi-personnalisées. Concrètement, Marvell apportera des XPU (processeurs accélérés sur mesure) et un réseau évolutif compatible, tandis que NVIDIA fournit l'ensemble de son arsenal matériel : processeurs Vera, cartes réseau ConnectX, DPU BlueField, interconnexion NVLink, commutateurs Spectrum-X et capacité de calcul déployable en rack. Le titre Marvell a bondi de 11 % dès l'annonce mardi, signe que les marchés ont immédiatement perçu la portée de l'accord. Le partenariat couvre également les réseaux télécoms, via NVIDIA Aerial AI-RAN, avec des ambitions sur la 5G et la future 6G, ainsi que sur des technologies d'interconnexion optique et de photonique sur silicium pour améliorer les performances et réduire la consommation énergétique. Pour les entreprises qui développent leurs propres puces d'accélération, NVLink Fusion ouvre la voie à des architectures hybrides entièrement compatibles avec l'écosystème NVIDIA — GPU, réseau et stockage compris. C'est un changement structurel : jusqu'ici, intégrer des composants tiers dans une infrastructure NVIDIA relevait du casse-tête d'interopérabilité. Désormais, les hyperscalers, opérateurs télécom et acteurs du cloud pourront combiner des XPU Marvell avec la stack NVIDIA sans friction. Pour les utilisateurs finaux, l'impact est indirect mais réel : des modèles d'IA générative plus complexes pourront tourner à moindre latence, ce qui se traduit par des services de recommandation, de création de contenu ou de simulation plus réactifs. Dans les télécoms, l'alliance prépare le terrain pour des réseaux 5G/6G capables de supporter des usages exigeants comme la télémédecine en temps réel ou les véhicules autonomes. Ce rapprochement s'inscrit dans un contexte de demande explosive en capacité de calcul, portée par la généralisation de l'IA générative et l'explosion des volumes de données. Jensen Huang, PDG de NVIDIA, parle lui-même d'une "ère de supercalcul" en cours d'avènement. Face à cette pression, les grandes entreprises technologiques mondiales s'engagent dans une course à la construction de centres de calcul dédiés, et NVIDIA cherche à s'imposer comme la colonne vertébrale incontournable de ces infrastructures. Marvell, de son côté, se repositionne comme fournisseur clé de silicium personnalisé pour l'IA — un marché en pleine effervescence où Amazon, Google et Microsoft développent déjà leurs propres puces. L'investissement de 2 milliards de dollars de NVIDIA dans Marvell est autant un signal industriel qu'une manœuvre défensive : consolider l'écosystème avant que les alternatives ne s'imposent.

UELes opérateurs télécom et fournisseurs cloud européens pourront intégrer des architectures hybrides XPU Marvell / stack NVIDIA sans friction, accélérant leurs déploiements 5G/6G et d'IA générative.

💬 NVIDIA ne se contente plus de vendre des GPU, il construit le système nerveux de toute l'infrastructure IA. NVLink Fusion, c'est le genre de coup qu'on voit venir mais dont on mesure mal l'ampleur : permettre à Marvell (et demain à d'autres) de brancher leurs puces custom directement dans l'écosystème NVIDIA, c'est verrouiller le marché de façon beaucoup plus subtile qu'un simple rachat. Les 2 milliards d'investissement, c'est pas de la philanthropie, c'est de la consolidation défensive avant qu'AMD ou les hyperscalers in-house ne s'imposent.

InfrastructureOpinion
1 source
Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA
2Le Big Data 

Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA

Nvidia et IREN ont annoncé le 7 mai 2026 un partenariat stratégique visant à déployer jusqu'à 5 gigawatts d'infrastructures IA à travers le réseau mondial de centres de données d'IREN. L'accord s'appuie sur l'architecture DSX de Nvidia, conçue pour industrialiser le déploiement de clusters GPU à très grande échelle. Un contrat de 3,4 milliards de dollars a également été signé dans ce cadre, par lequel IREN fournira des services cloud d'infrastructure IA pour les besoins internes de Nvidia. Le campus texan de Sweetwater, site de 2 gigawatts présenté comme le futur projet phare de ce déploiement, concentrera une grande partie des investissements initiaux. Dans cette architecture, Nvidia apporte la puissance de calcul accélérée et l'expertise en infrastructure, tandis qu'IREN prend en charge l'énergie, le foncier, l'exploitation des data centers et le déploiement physique des clusters GPU. Ce partenariat illustre un basculement profond dans la façon dont se joue la compétition dans l'IA. Pendant des années, l'avantage concurrentiel reposait avant tout sur les performances des modèles et l'accès aux puces. Désormais, la capacité à construire rapidement des infrastructures capables d'alimenter en continu l'entraînement et l'inférence de modèles devient tout aussi décisive. Les cibles prioritaires de ce projet sont les entreprises natives de l'IA, les startups spécialisées et les grands groupes à fort besoin de calcul. Jensen Huang, fondateur et PDG de Nvidia, résume cette vision en affirmant que les "AI factories deviennent une infrastructure fondamentale comparable aux réseaux électriques ou aux télécommunications". Cette déclaration marque le repositionnement explicite de Nvidia : l'entreprise ne vend plus uniquement des GPU, mais une offre complète d'infrastructure IA à l'échelle industrielle. Ce mouvement s'inscrit dans une dynamique plus large où la question énergétique devient aussi stratégique que l'accès aux semi-conducteurs. Le Texas attire une part croissante des investissements dans l'IA et les data centers grâce à son accès à l'énergie, ses disponibilités foncières et ses infrastructures industrielles. IREN occupe une position particulière sur ce marché avec un modèle verticalement intégré qui combine centres de données, accès aux réseaux électriques et clusters GPU, le tout implanté dans des régions riches en énergies renouvelables en Amérique du Nord. Le partenariat avec Nvidia lui confère une crédibilité et une visibilité sans précédent pour capter les besoins colossaux en infrastructure que génère la généralisation de l'IA générative dans les entreprises. Les 5 GW annoncés seront déployés progressivement, ce qui laisse entendre que d'autres sites viendront compléter Sweetwater dans les prochaines années.

💬 5 GW, c'est un chiffre qui donne le vertige. Ce qui m'intéresse là-dedans, c'est pas tellement le partenariat Nvidia-IREN en lui-même, mais ce que ça confirme : l'accès à l'énergie et au foncier est en train de devenir le vrai goulot d'étranglement de l'IA, pas les GPU. Et pendant qu'on débat de réglementation en Europe, le Texas construit.

InfrastructureOpinion
1 source
NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
3NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

InfrastructureOpinion
1 source
De nouvelles licornes dans l'infrastructure IA : Exa, Modal, TurboPuffer
4Latent Space 

De nouvelles licornes dans l'infrastructure IA : Exa, Modal, TurboPuffer

Trois entreprises spécialisées dans l'infrastructure pour l'intelligence artificielle ont atteint simultanément des jalons majeurs cette semaine, signalant une consolidation rapide du secteur. TurboPuffer, moteur de recherche vectorielle, annonce 100 millions de dollars de revenus récurrents annuels tout en étant rentable. Exa, moteur de recherche sémantique pour les agents IA, lève 250 millions de dollars dans un tour de Série C qui valorise l'entreprise à 2,2 milliards de dollars. Modal, plateforme cloud de calcul GPU à la demande, annonce quant à elle 355 millions de dollars levés à une valorisation de 4,7 milliards de dollars en Série C. Ces trois annonces tombent dans la même fenêtre de 48 heures, les 20 et 21 mai 2026. Ces chiffres illustrent une dynamique structurelle : l'explosion de la demande en infrastructure IA n'est plus portée uniquement par les grands hyperscalers comme AWS ou Google Cloud, mais de plus en plus par des acteurs spécialisés capables de répondre précisément aux besoins des développeurs d'agents et de pipelines LLM. Modal permet d'exécuter du code Python avec des GPU en quelques secondes sans gérer de serveurs ; Exa fournit une API de recherche conçue pour les LLM plutôt que pour les humains ; TurboPuffer offre une base de données vectorielle haute performance. Que les trois atteignent ces valorisations en même temps indique que le marché des outils pour construire des applications IA génère désormais des revenus réels et prévisibles, pas seulement des promesses. Ces succès s'inscrivent dans un contexte où l'ingénierie IA est devenue une discipline à part entière, distincte de la recherche fondamentale en machine learning. L'émergence d'une couche d'infrastructure spécialisée, entre les modèles de fondation des grands labs et les applications finales, crée un espace économique autonome. Latent Space, le podcast et newsletter qui suit ces entreprises depuis leurs débuts, note avoir interviewé les fondateurs des trois sociétés bien avant ces valorisations, soulignant à quel point la communauté des praticiens IA identifie tôt les acteurs structurants. La question désormais est de savoir si ces entreprises resteront indépendantes ou deviendront des cibles d'acquisition pour les grandes plateformes cloud, qui cherchent à intégrer verticalement la chaîne de valeur du développement IA.

UELes développeurs français et européens d'applications IA disposent désormais d'une couche d'infrastructure spécialisée (compute GPU à la demande, recherche vectorielle, recherche sémantique pour LLMs) comme alternative aux grands hyperscalers pour leurs pipelines d'agents.

💬 TurboPuffer rentable à 100M ARR, Modal à 4,7 milliards, Exa à 2,2, tout ça en 48h, c'est pas du hasard. J'attendais ce signal pour confirmer que la couche infra entre les grands modèles et les applis génère vraiment de l'argent, pas juste du cashburn déguisé en croissance. Si tu construis des trucs avec des LLMs, ces outils sont soit déjà dans ta stack, soit tu vas y venir.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour