Aller au contenu principal
Databricks et Nvidia préparent ensemble l’avenir de l’IA agentique
InfrastructureLe Big Data2h· 2 min de lecture

Databricks et Nvidia préparent ensemble l’avenir de l’IA agentique

Source originale ↗·

Databricks et Nvidia ont annoncé lors du Data + AI Summit un renforcement significatif de leur partenariat, centré sur le déploiement industriel de l'IA agentique en entreprise. Les deux groupes intègrent désormais plus profondément leurs infrastructures matérielles et logicielles, avec un accès serverless aux GPU Nvidia A10 et H100 directement dans la plateforme Databricks via un environnement baptisé AI Runtime (AIR). Les GPU Hopper, couplés au réseau Quantum InfiniBand, prennent en charge les entraînements distribués à grande échelle, tandis que la compatibilité avec l'architecture Blackwell prépare l'accès aux prochaines générations de puissance de calcul. Databricks a également annoncé la prise en charge des GPU Nvidia dans son édition gratuite, ainsi que le support prochain des conteneurs NGC et des environnements CUDA personnalisés, permettant aux équipes d'exécuter leurs stacks spécialisées sans multiplier les couches d'infrastructure externes.

Ce tournant est stratégique pour les entreprises qui ne se contentent plus d'expérimenter l'IA générative : elles cherchent à industrialiser des agents capables de raisonner, d'agir et d'interagir avec leurs données métier dans des environnements sécurisés et gouvernés. L'accès GPU dans l'édition gratuite de Databricks abaisse concrètement la barrière d'entrée pour les startups, développeurs indépendants et équipes de recherche à budgets limités, ce qui pourrait accélérer significativement l'adoption de l'IA avancée hors des grandes entreprises. La réduction de la complexité opérationnelle, en rapprochant entraînement et déploiement des données gouvernées, répond à l'un des freins majeurs identifiés dans les projets d'IA en production.

Le partenariat entre Databricks et Nvidia s'inscrit dans une mutation plus profonde des architectures d'IA. Les grands modèles de langage ont jusqu'ici concentré l'attention sur les GPU pour l'inférence, mais les agents autonomes de nouvelle génération exigent bien davantage : exécution d'appels d'outils, interrogation de bases de données, coordination de plusieurs étapes de raisonnement en temps réel, interaction avec des systèmes métiers hétérogènes. C'est dans ce contexte que Nvidia met en avant Vera, son futur processeur conçu pour ces charges de travail agentiques hybrides, combinant CPU et GPU dans une même puce. Databricks, valorisé 62 milliards de dollars lors de sa dernière levée de fonds en 2024, positionne ainsi sa plateforme comme la couche d'orchestration centrale pour les entreprises qui construisent la prochaine vague d'IA, au moment où la concurrence avec Snowflake, Google et Microsoft s'intensifie sur ce segment précis du marché.

Impact France/UE

Les entreprises européennes utilisant Databricks pour leurs projets d'IA peuvent désormais accéder directement aux GPU Nvidia au sein de la plateforme sans couches d'infrastructure supplémentaires, réduisant la complexité opérationnelle de l'industrialisation de l'IA agentique.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1NVIDIA AI Blog 

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

NVIDIA et ses partenaires industriels investissent Hannover Messe 2026, le salon phare de l'industrie manufacturière qui se tient du 20 au 24 avril à Hanovre, en Allemagne, pour y présenter ce qu'ils considèrent comme la prochaine révolution de la production : l'usine pilotée par l'intelligence artificielle. Au programme, des démonstrations concrètes couvrant l'informatique accélérée, la simulation physique en temps réel, les agents autonomes et les robots humanoïdes opérant en environnement industriel. Parmi les temps forts, l'annonce de l'Industrial AI Cloud, l'un des plus grands centres d'IA d'Europe, construit en Allemagne par Deutsche Telekom sur infrastructure NVIDIA. Des géants comme SAP, Siemens, ABB, Dassault Systèmes, Cadence ou encore Synopsys y participent, aux côtés d'acteurs spécialisés comme Agile Robots, Wandelbots et PhysicsX. EDAG, prestataire indépendant d'ingénierie, a par ailleurs annoncé le déploiement de sa plateforme de métavers industriel "metys" sur ce cloud souverain, ciblant l'automobile et l'ingénierie lourde. L'enjeu est considérable : l'industrie manufacturière mondiale fait face à une pression simultanée sur les cycles de conception, les coûts opérationnels et la disponibilité de main-d'œuvre qualifiée. L'IA n'est plus une option expérimentale mais un levier de compétitivité immédiat. Les jumeaux numériques à l'échelle d'une usine entière, construits sur les bibliothèques Omniverse de NVIDIA et le standard ouvert OpenUSD, permettent désormais de simuler, tester et optimiser des lignes de production en continu, sans interruption physique. ABB, par exemple, intègre ces outils dans sa suite Genix pour analyser la performance des équipements et accélérer la recherche de causes de pannes via des agents IA. Pour les ingénieurs, la simulation physique en temps réel change radicalement le processus de conception : là où des heures de calcul étaient nécessaires, des résultats apparaissent en secondes. Cette offensive de NVIDIA dans l'industrie s'inscrit dans une stratégie plus large visant à faire de l'informatique accélérée le socle de la transformation industrielle européenne. Le concept de "souveraineté numérique" est central : face aux craintes européennes de dépendance aux clouds américains, l'Industrial AI Cloud positionné en Allemagne répond à une demande politique autant qu'économique. CUDA-X, Omniverse, les modèles ouverts Nemotron et les puces NVIDIA équipent désormais les logiciels des éditeurs les plus influents du secteur, de Siemens à Dassault Systèmes, créant un écosystème interdépendant difficile à contourner. Dell, IBM, Lenovo et PNY complètent l'offre avec des systèmes accélérés déployables de la périphérie jusqu'aux datacenters. La prochaine étape, déjà visible à Hanovre, est l'intégration de robots humanoïdes dans les chaînes de production, un marché où NVIDIA entend jouer un rôle d'infrastructure aussi structurant que dans l'IA générative.

UEL'Industrial AI Cloud inauguré en Allemagne par Deutsche Telekom sur infrastructure NVIDIA, avec la participation de Dassault Systèmes et Siemens, offre aux industriels européens une infrastructure cloud souveraine pour déployer l'IA en production.

InfrastructureActu
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
2NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
NVIDIA et la Corée du Sud s'associent pour construire l'avenir de l'IA
3NVIDIA AI Blog 

NVIDIA et la Corée du Sud s'associent pour construire l'avenir de l'IA

Jensen Huang, fondateur et PDG de Nvidia, a atterri à Séoul vendredi 4 juin, accueilli par des fans et des journalistes dès sa descente d'avion. Ce déplacement fait suite à la conférence GTC Taipei organisée lors du COMPUTEX, et s'inscrit dans une tournée asiatique chargée. Huang a tenu à préciser l'enjeu central de sa visite : aligner la chaîne d'approvisionnement en IA avant une deuxième partie d'année qui s'annonce intense. Il a confirmé que Grace Blackwell, la plateforme phare de Nvidia, affiche de solides performances commerciales, et que Vera Rubin, la génération suivante, est désormais en pleine production industrielle. "Le premier semestre a déjà été très réussi, et nous allons être très occupés au second semestre", a-t-il déclaré à la presse. La Corée du Sud n'est pas un simple arrêt diplomatique dans l'agenda de Huang : c'est l'un des maillons stratégiques de l'écosystème mondial de l'IA. Le pays abrite des acteurs critiques de la fabrication de mémoires, une communauté gaming parmi les plus actives au monde, et un tissu industriel en robotique en pleine montée en puissance. Huang a explicitement identifié la robotique et l'IA physique comme "le prochain grand secteur" pour la Corée, appelant à des investissements ciblés dans ce domaine. Ce positionnement n'est pas anodin : la robotique incarnée, qui nécessite des puces, des capteurs et des modèles d'inférence rapide, est précisément le terrain où Nvidia cherche à imposer ses architectures comme standard de fait. La visite de Huang à Séoul s'inscrit dans une dynamique plus large de consolidation des alliances industrielles face à la pression géopolitique sur les semi-conducteurs. Alors que les restrictions américaines sur les exportations de puces vers certains marchés asiatiques compliquent le paysage, la Corée du Sud reste un partenaire de premier plan, à la fois client et fournisseur clé via Samsung et SK Hynix. Le programme de la visite inclut des rencontres avec des partenaires locaux dans la mémoire, la robotique et le gaming, avant que Huang ne passe à la table pour du poulet frit et du barbecue coréen, qu'il a jugés, sobrement, "délicieux".

UELes entreprises européennes dépendantes des puces NVIDIA et de la mémoire coréenne (Samsung, SK Hynix) pourraient bénéficier indirectement d'une chaîne d'approvisionnement renforcée, mais l'impact direct sur la France ou l'UE reste limité.

InfrastructureOpinion
1 source
NVIDIA et Google réduisent les coûts d'inférence en IA
4AI News 

NVIDIA et Google réduisent les coûts d'inférence en IA

Lors de la conférence Google Cloud Next, Google et NVIDIA ont dévoilé une nouvelle génération d'infrastructure destinée à réduire drastiquement le coût de l'inférence IA à grande échelle. Les deux entreprises ont présenté les instances A5X bare-metal, reposant sur les systèmes rack NVIDIA Vera Rubin NVL72. Cette architecture promet une réduction jusqu'à dix fois du coût d'inférence par token par rapport aux générations précédentes, tout en multipliant par dix le débit de tokens par mégawatt. Pour atteindre ces performances, les instances A5X combinent les SuperNICs NVIDIA ConnectX-9 avec la technologie réseau Google Virgo, permettant de connecter jusqu'à 80 000 GPU NVIDIA Rubin au sein d'un même site, et jusqu'à 960 000 GPU dans un déploiement multi-sites. Mark Lohmeyer, VP et directeur général de l'infrastructure IA chez Google Cloud, a résumé l'enjeu : "La prochaine décennie de l'IA sera façonnée par la capacité des entreprises à faire tourner leurs charges de travail les plus exigeantes sur une infrastructure vraiment intégrée et optimisée pour l'IA." Ces annonces ont un impact direct sur les secteurs fortement réglementés, comme la finance et la santé, qui butent régulièrement sur des contraintes de souveraineté des données. Google et NVIDIA y répondent avec plusieurs initiatives concrètes : les modèles Gemini fonctionnant sur GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en préversion sur Google Distributed Cloud, ce qui permet aux organisations de garder les modèles frontier entièrement dans leur environnement contrôlé, au plus près de leurs données sensibles. La sécurité est assurée par NVIDIA Confidential Computing, un protocole de chiffrement matériel qui protège les données d'entraînement et les prompts y compris vis-à-vis des opérateurs cloud eux-mêmes. Pour les environnements cloud public multi-tenant, des VM Confidential G4 équipées de GPU NVIDIA RTX PRO 6000 Blackwell sont également introduites en préversion, marquant la première offre de confidential computing cloud pour des GPU Blackwell. Cette collaboration s'inscrit dans une course plus large à l'optimisation de l'inférence, alors que les coûts opérationnels de l'IA générative restent un frein majeur à son adoption industrielle. Au-delà du matériel, le partenariat couvre aussi la couche logicielle : NVIDIA Nemotron 3 Super est désormais disponible sur la Gemini Enterprise Agent Platform, permettant aux développeurs de construire des systèmes agentiques complexes capables de raisonner, planifier et agir en chaîne. L'ensemble de la plateforme NVIDIA sur Google Cloud est optimisé pour les familles de modèles Gemini et Gemma. Avec des clusters dépassant le million de GPU et une ambition affichée de simplifier le déploiement d'IA souveraine, Google et NVIDIA repositionnent l'infrastructure cloud non plus comme un simple fournisseur de puissance de calcul, mais comme un levier stratégique pour les entreprises qui veulent industrialiser l'IA sans sacrifier performance, coût ou conformité réglementaire.

UELes entreprises européennes des secteurs réglementés (finance, santé) disposent désormais d'options d'infrastructure IA souveraine compatibles avec les exigences RGPD, réduisant un frein concret à l'industrialisation de l'IA en Europe.

InfrastructureActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic