InfrastructureNVIDIA AI Blog · 16 juin 2026, 19:30· 2 min de lecture

HPE AI Factory avec NVIDIA s'étend à l'ère des agents autonomes

HPE et NVIDIA ont annoncé lors de la conférence HPE Discover à Las Vegas, qui se tient jusqu'au 18 juin 2026, une expansion majeure de leur plateforme conjointe HPE AI Factory with NVIDIA. Les deux groupes y introduisent plusieurs nouveautés : le processeur NVIDIA Vera CPU intégré au serveur HPE ProLiant Compute DL394 Gen12, disponible en 2027, ainsi que le NVIDIA Agent Toolkit désormais inclus dans HPE Private Cloud AI. La plateforme s'enrichit également du calcul confidentiel NVIDIA (Confidential Computing) sur l'ensemble de la gamme, et d'un nouveau système HPE Compute XD700 fondé sur l'architecture NVIDIA HGX Rubin NVL8, capable d'accueillir jusqu'à 128 GPU Rubin par rack. La Bourse de New York (NYSE), en partenariat avec Redpanda et HPE, fait partie des premiers clients entreprises à explorer le Vera CPU sur ce serveur.

Ces annonces marquent un tournant dans l'industrialisation de l'IA agentique : les entreprises ne testent plus des preuves de concept, elles déploient des systèmes autonomes en production. Le Vera CPU est conçu spécifiquement pour les boucles agentiques, c'est-à-dire les appels d'outils, l'orchestration de tâches et le traitement de données en temps réel que requièrent les agents IA modernes. Le NVIDIA Agent Toolkit apporte un système d'exploitation agentique complet incluant les modèles ouverts Nemotron, un environnement d'exécution sécurisé (OpenShell) et des blueprints NemoClaw. HPE y ajoute un registre local d'agents permettant aux entreprises de valider modèles, compétences et outils avant leur déploiement, tandis que le logiciel HPE Zerto détecte les comportements aberrants et peut revenir à un état sain grâce à une protection continue des données.

La sécurité des charges de travail IA constitue l'autre axe structurant de cette expansion. Le calcul confidentiel NVIDIA, désormais disponible sur toute la gamme HPE AI Factory via HPE Services, protège les modèles et les données sensibles pendant leur exécution, notamment pour les déploiements souverains ou sur site où la confidentialité est une contrainte réglementaire. Les cartes réseau NVIDIA BlueField et la pile logicielle NVIDIA DOCA assurent une politique de zéro confiance appliquée directement dans le silicium, avec chiffrement réseau et détection des menaces sans pénalité de performance. Cette orientation répond à une pression croissante des secteurs réglementés, finance, santé, défense, qui cherchent à exploiter des agents autonomes sans exposer leurs données propriétaires. La plateforme Vera Rubin, qui sous-tend ces systèmes, est elle-même calibrée pour des modèles de plus d'un trillion de paramètres, positionnant HPE et NVIDIA au cœur de la prochaine vague d'infrastructure IA à l'échelle frontier.

Impact France/UE

Le calcul confidentiel NVIDIA et les options de déploiement souverain on-premise répondent directement aux contraintes réglementaires européennes (RGPD, AI Act) pesant sur les secteurs finance, santé et défense.

Dans nos dossiers

NVIDIA Agents IA Souveraineté IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

SK hynix et NVIDIA étendent leur partenariat autour des AI Factories

SK hynix et NVIDIA ont annoncé le 7 juin 2026 un partenariat technologique pluriannuel centré sur le codéveloppement de mémoires de nouvelle génération pour les infrastructures d'IA mondiales. L'accord couvre un spectre large : les supercalculateurs d'IA Vera Rubin, les processeurs Vera, les PC RTX Spark et les plateformes robotiques Jetson Thor. Au-delà de la mémoire, les deux groupes prévoient d'appliquer l'intelligence artificielle à la conception et à la fabrication des semi-conducteurs eux-mêmes, en mobilisant les bibliothèques CUDA-X de NVIDIA et le framework PhysicsNeMo pour accélérer les simulations de puces, la lithographie computationnelle et les flux de conception assistée par ordinateur. Ce partenariat répond à une tension structurelle qui pèse sur toute l'industrie : les cycles de conception et de production des mémoires avancées sont longs et coûteux, alors que la demande explose avec l'essor des centres de données spécialisés en IA. Pour NVIDIA, sécuriser un fournisseur mémoire synchronisé avec sa propre feuille de route est devenu aussi stratégique que la conception des GPU eux-mêmes. Pour SK hynix, l'accord représente une montée en gamme décisive : l'entreprise coréenne sort du marché traditionnel des centres de données pour s'imposer sur deux segments que NVIDIA considère comme ses prochains relais de croissance, l'IA personnelle et l'IA physique, c'est-à-dire la robotique. L'utilisation de jumeaux numériques pour simuler les usines de semi-conducteurs pourrait par ailleurs réduire significativement les délais de développement à mesure que la complexité des puces continue de croître. Ce rapprochement s'inscrit dans une recomposition plus large des chaînes d'approvisionnement technologiques, accélérée par la course mondiale aux infrastructures d'IA. Les grands fournisseurs de GPU ne se contentent plus de concevoir des accélérateurs : ils cherchent à verrouiller en amont les composants critiques, dont la mémoire à haute bande passante est aujourd'hui le principal goulot d'étranglement pour l'entraînement et l'inférence des grands modèles. SK hynix, déjà premier fournisseur mondial de mémoire HBM, renforce ainsi une position concurrentielle face à Samsung et Micron. L'intégration de l'IA dans les processus industriels de fabrication de puces ouvre également la voie à une collaboration plus étroite entre fondeurs, concepteurs de GPU et éditeurs de logiciels EDA, un écosystème encore fragmenté dont NVIDIA cherche visiblement à devenir le pivot central.

UELes centres de données européens dépendent des mémoires HBM de SK hynix pour leurs infrastructures IA, ce partenariat renforce la dépendance stratégique de l'UE envers des fournisseurs non-européens de composants critiques.

InfrastructureOpinion

1 source

2Ars Technica AI

Google dévoile deux nouveaux TPU conçus pour l'ère des agents autonomes

Google a dévoilé sa huitième génération de puces TPU (Tensor Processing Units), marquant une évolution significative dans l'architecture de ses accélérateurs d'intelligence artificielle. Contrairement à une simple amélioration itérative, cette génération se décline en deux variantes distinctes : le TPU 8t, dédié à l'entraînement des modèles, et le TPU 8i, optimisé pour l'inférence. L'annonce fait suite au lancement de l'Ironwood, la septième génération, présenté en 2025. Selon Google, le TPU 8t permettrait de réduire la durée d'entraînement des modèles d'IA frontier de plusieurs mois à quelques semaines seulement. Cette bifurcation matérielle reflète une lecture stratégique de l'évolution de l'IA : les systèmes dits "agentiques", capables d'agir de façon autonome sur des tâches complexes, génèrent des charges de travail très différentes de celles des modèles conversationnels classiques. Séparer l'entraînement de l'inférence au niveau du silicium permet d'optimiser chaque phase indépendamment, avec des gains attendus en vitesse et en efficacité énergétique. Pour les entreprises clientes de Google Cloud, cela se traduit potentiellement par des coûts réduits et des cycles de développement accélérés. Google se distingue depuis longtemps du reste de l'industrie en misant sur ses propres puces plutôt que sur les accélérateurs Nvidia, qui dominent largement le marché de l'IA. Cette stratégie verticale lui confère un avantage en termes de contrôle de la chaîne d'approvisionnement et d'optimisation logicielle, mais implique des investissements considérables en R&D. La montée en puissance des agents IA, capables d'enchaîner des raisonnements et d'interagir avec des outils externes, intensifie la demande en inférence continue et à faible latence, un terrain sur lequel le TPU 8i est précisément conçu pour s'imposer. La prochaine étape sera de savoir si ces puces tiennent leurs promesses face aux solutions Nvidia dans des benchmarks réels.

UELes entreprises européennes utilisant Google Cloud pourraient bénéficier de coûts d'entraînement réduits et de cycles de développement accélérés grâce à ces nouvelles puces.

InfrastructureOpinion

1 source

3The Decoder

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Microsoft et Nvidia s'apprêtent à dévoiler conjointement une nouvelle génération d'ordinateurs sous Windows, prévue pour la semaine prochaine lors des conférences Computex et Build. Pour la première fois, Nvidia y imposera ses propres puces en tant que processeur principal, rompant avec le monopole d'Intel et AMD sur ce segment. Les premiers appareils concernés seront des machines Dell ainsi que des modèles de la gamme Surface de Microsoft, confirmant une collaboration industrielle inédite entre les deux géants. Le tournant majeur réside dans le logiciel : Microsoft prépare une nouvelle plateforme logicielle basée sur le framework OpenClaw, conçue pour permettre à des agents IA d'exécuter des tâches directement en local sur les PC Windows. Contrairement aux assistants cloud, ces agents fonctionneraient sans connexion internet, traitant données et automatisations directement sur la machine. Pour les professionnels et entreprises soucieux de confidentialité ou de latence, cela représente un changement de paradigme concret dans l'usage quotidien de l'IA. Cette initiative s'inscrit dans la tentative de Microsoft de relancer sa vision des PC augmentés par l'IA, après l'échec commercial relatif des Copilot+ PC lancés en 2024, dont les fonctionnalités comme Recall avaient suscité plus de controverses que d'enthousiasme. En s'appuyant cette fois sur les puces Nvidia et un cadre d'agents autonomes plus opérationnel, Microsoft cherche à convaincre le marché que l'IA embarquée peut tenir ses promesses de productivité réelle. La bataille pour définir le PC de l'ère agentique ne fait que commencer.

UELes entreprises françaises et européennes, particulièrement sensibles au RGPD, bénéficieront d'agents IA fonctionnant en local sans transfert de données vers le cloud, réduisant les risques de conformité.

💬 Après le fiasco Recall, Microsoft repart avec Nvidia et des agents qui tournent en local, sans connexion. Pour les boîtes coincées entre IA et RGPD, c'est le premier truc qui tient vraiment la route depuis longtemps. Bon, faut quand même que ça tienne en prod, parce que les promesses sur les PC IA, on commence à connaître.

InfrastructureOpinion

1 source

4Le Big Data

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Le 16 mars 2026, lors de la conférence GTC 2026, Jensen Huang a présenté le processeur CPU Vera, une puce conçue spécifiquement pour l'intelligence artificielle agentique. Architecturé autour de la plateforme Olympus, Vera embarque 88 cœurs personnalisés basés sur la technologie ARM Neoverse, une mémoire SOCAMM en LPDDR6 atteignant une bande passante de 1,2 To/s, et une conception monolithique qui réduit la latence interne au minimum physiquement possible. Contrairement aux GPU Blackwell et Rubin qui gèrent le traitement parallèle massif, Vera prend en charge l'exécution séquentielle et logique : la planification, la vérification, l'enchaînement de décisions. Sa capacité à manipuler des contextes de plusieurs millions de tokens en temps réel en fait un composant radicalement différent des processeurs x86 traditionnels, jugés trop lents pour les exigences actuelles de l'IA. L'enjeu est fondamental pour toute entreprise qui cherche à déployer des agents IA dans des workflows réels. Jusqu'ici, les systèmes d'IA buttaient sur le goulot d'étranglement du raisonnement séquentiel : générer du texte rapidement ne suffit pas pour gérer du code complexe, de la logistique ou de la prise de décision multi-étapes. Vera permet à l'IA de passer d'un outil passif à un collaborateur capable d'orchestrer des tâches sur la durée, de corriger ses propres erreurs et d'enchaîner des raisonnements structurés sans latence perceptible. Pour les développeurs et les entreprises, cela ouvre concrètement la voie à des agents autonomes opérationnels dans des environnements de production exigeants, là où les solutions actuelles restent trop fragiles ou trop lentes. Cette annonce s'inscrit dans une accélération que NVIDIA pilote depuis plusieurs années en construisant une pile matérielle complète pour l'IA. Après avoir dominé l'entraînement des modèles avec ses GPU, puis l'inférence avec la gamme Blackwell, l'entreprise complète aujourd'hui l'architecture avec un CPU qui lui est propre, réduisant sa dépendance aux processeurs Intel et AMD pour les charges de travail IA. Le concept rappelle la distinction cognitive entre Système 1 (rapide, instinctif) et Système 2 (analytique, délibéré) : les GPU couvrent le premier, Vera prend en charge le second. Si l'adoption suit, NVIDIA pourrait imposer une architecture propriétaire de bout en bout pour les data centers orientés agents, ce qui renforcerait encore davantage sa position dominante dans l'infrastructure de l'IA mondiale au moment où la course aux systèmes autonomes s'intensifie chez Google, Microsoft et Meta.

UELes opérateurs de data centers européens déployant des agents IA devront évaluer une migration vers cette architecture propriétaire NVIDIA pour contourner les goulots d'étranglement du raisonnement séquentiel.

💬 Le goulot d'étranglement du raisonnement séquentiel, c'est le truc qui fait ramer les agents en prod depuis 2 ans, et Vera s'attaque frontalement à ça. La distinction Système 1/Système 2 appliquée au silicium, c'est bien vu, pas juste du marketing. Le revers, c'est que si t'as besoin de Vera pour que tes agents tournent vraiment, t'achètes le stack NVIDIA complet, de bout en bout, et ils le savent.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic