Aller au contenu principal
InfrastructureLatent Space2h· 2 min de lecture

Pourquoi l'écosystème frontier doit rester ouvert

Source originale ↗·

Databricks, valorisée 175 milliards de dollars, a profité de son Data + AI Summit 2026 pour annoncer plusieurs produits majeurs, dont Omnigent, LTAP, Lakebase et Genie One. Les cofondateurs Matei Zaharia et Reynold Xin y ont exposé une thèse centrale : les modèles de langage sont en train de se banaliser, et l'avantage concurrentiel durable appartient désormais à ceux qui maîtrisent les données et l'infrastructure autour. Omnigent est le premier fruit de cette vision, un méta-orchestrateur open source qui unifie plusieurs agents IA existants (Claude Code, Codex, Cursor, Pi, agents internes d'entreprise) sous une API commune, gérant les sessions persistantes, les fichiers partagés, les appels d'outils, les contrôles de dépenses et les droits d'accès. LTAP, de son côté, propose une nouvelle architecture de base de données qui remplace la réplication par capture de changements (CDC), que Zaharia qualifie d'approche produisant de la "corruption continue de données", en unifiant la couche de stockage plutôt qu'en multipliant les moteurs de requêtes.

L'enjeu est considérable pour toute l'industrie enterprise : aujourd'hui, les agents IA ne deviennent vraiment utiles que s'ils disposent du bon contexte au bon moment, historique des transactions, permissions granulaires, état opérationnel, flux métier en temps réel. Jusqu'ici, les entreprises devaient assembler un lac de données, un entrepôt, une plateforme ML et une couche de gouvernance séparés. Databricks a convaincu les grandes organisations qu'une fondation ouverte et unifiée suffisait. La prochaine étape, selon Zaharia et Xin, consiste à transformer cette fondation en système d'exploitation pour agents : une couche qui expose exactement la bonne tranche de données, d'état et de logique métier à un système IA au moment précis où il agit. Le déploiement d'Omnigent en open source vise aussi à accélérer l'adoption en évitant l'enfermement propriétaire que Databricks reproche aux harness fermés.

Databricks est née au Berkeley AMPLab avec Apache Spark, avant de populariser le concept de Lakehouse, l'idée qu'un seul socle ouvert peut remplacer plusieurs couches de données disparates. Depuis son introduction en Bourse reportée et sa valorisation record, la société est sous pression pour démontrer que son pari sur l'open source et la donnée d'entreprise tient face à Snowflake et aux hyperscalers. La montée en puissance des agents autonomes lui offre une fenêtre stratégique : si la performance brute des modèles se commoditise, ce qui reste différenciant, c'est précisément ce que Databricks a construit depuis dix ans, données propriétaires gouvernées, logs transactionnels, workflows, boucles de rétroaction. Le pari de Databricks est que la prochaine vague de logiciels d'entreprise sera entièrement réécrite une fois que les agents auront accès à ces fondations de données solides, faisant de la plateforme le point de passage obligé de l'IA en production.

Impact France/UE

Les entreprises européennes déployant des agents IA en production pourraient adopter Omnigent comme orchestrateur open source pour éviter la dépendance aux stacks propriétaires américains.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
1NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
NVIDIA lance Ising : sa première famille de modèles d'IA quantique ouverts pour systèmes hybrides quantique-classique
2MarkTechPost 

NVIDIA lance Ising : sa première famille de modèles d'IA quantique ouverts pour systèmes hybrides quantique-classique

NVIDIA a lancé Ising, la première famille de modèles d'IA quantique ouverts au monde, conçue pour aider chercheurs et entreprises à construire des processeurs quantiques capables de faire tourner des applications réelles. La famille comprend deux composants distincts : Ising Calibration, un modèle de langage visuel qui interprète en temps réel les mesures des processeurs quantiques et ajuste automatiquement le système pour le maintenir en fonctionnement optimal, réduisant les temps de calibration de plusieurs jours à quelques heures ; et Ising Decoding, disponible en deux variantes de réseau de neurones convolutif 3D optimisées respectivement pour la vitesse et la précision, qui effectuent le décodage d'erreurs quantiques en temps réel. Ising Decoding se montre jusqu'à 2,5 fois plus rapide et 3 fois plus précis que pyMatching, l'actuel standard open source du secteur. Dès le premier jour, des organisations comme IonQ, IQM Quantum Computers, Infleqtion, le Fermi National Accelerator Laboratory, Harvard, Sandia National Laboratories, l'Université de Chicago et une douzaine d'autres acteurs académiques et commerciaux ont déjà adopté ces outils. L'enjeu est considérable : le principal frein au déploiement concret de l'informatique quantique n'est pas la puissance brute des processeurs, mais leur extrême sensibilité aux perturbations extérieures. Les qubits, unités de calcul fondamentales, accumulent des erreurs à une vitesse qui rend tout calcul utile quasiment impossible sans une calibration rigoureuse et une correction d'erreurs en temps réel. Ces deux opérations étaient jusqu'ici manuelles, lentes et difficiles à mettre à l'échelle. En automatisant ces processus critiques par l'IA, NVIDIA s'attaque directement au goulot d'étranglement qui sépare les démonstrateurs de laboratoire des machines véritablement opérationnelles. Une réduction des temps de calibration de plusieurs jours à quelques heures représente un gain de productivité transformateur pour les équipes de recherche. Ising s'inscrit dans la stratégie plus large de NVIDIA pour positionner ses GPU au coeur de l'informatique hybride quantique-classique. Les modèles Ising complètent CUDA-Q, la plateforme logicielle de NVIDIA pour les workflows hybrides, et s'intègrent avec NVQLink, l'interconnexion matérielle GPU-QPU développée par l'entreprise pour permettre une communication à faible latence entre processeurs graphiques et unités quantiques. Cette approche suit la même philosophie que CUDA pour l'accélération GPU : coupler étroitement calcul classique et calcul accéléré. Alors que des acteurs comme IBM, Google et des startups spécialisées investissent massivement dans la course au quantique, NVIDIA parie sur une stratégie de plateforme transversale, agnostique aux technologies de qubits, qui lui permet de s'imposer comme couche d'infrastructure indispensable quelle que soit la technologie gagnante.

UEIQM Quantum Computers (Finlande, UE) figure parmi les premiers adoptants, ce qui pourrait accélérer le développement de processeurs quantiques en Europe.

💬 La calibration des qubits qui passe de plusieurs jours à quelques heures, c'est le vrai goulot d'étranglement du quantique, et c'est la première fois qu'on voit une solution à la hauteur du problème. NVIDIA fait exactement ce qu'ils ont fait avec CUDA : s'imposer comme couche d'infra incontournable avant même de savoir quelle technologie va gagner. Harvard, Fermi Lab, IQM dès le premier jour, ça ne s'invente pas.

InfrastructureActu
1 source
Reconstruire la pile de données pour l'IA
3MIT Technology Review 

Reconstruire la pile de données pour l'IA

L'intelligence artificielle occupe désormais le sommet des priorités des directions d'entreprise, mais une réalité s'impose de plus en plus clairement : le principal frein à une adoption concrète n'est pas la technologie elle-même, mais l'état des données. Bavesh Patel, vice-président senior chez Databricks, résume le problème sans détour : "La qualité de l'IA, son efficacité réelle, dépend directement de l'information disponible dans votre organisation." Or dans la grande majorité des entreprises, cette information reste dispersée entre des systèmes hérités, des applications cloisonnées et des formats incompatibles. Sans infrastructure unifiée, les modèles d'IA produisent des résultats peu fiables, dépourvus de contexte, ce que Patel qualifie simplement de "terrible AI". La solution passe par une consolidation des données dans des formats ouverts, une gouvernance rigoureuse des accès, et une architecture capable de combiner données structurées et non structurées en temps réel. L'enjeu est directement compétitif. Pour Patel, "le vrai différenciateur concurrentiel de la plupart des organisations, c'est leur propre data, combinée aux données tierces qu'elles peuvent y ajouter". Les entreprises qui parviennent à poser ces fondations correctement débloquent des gains mesurables : automatisation de workflows complexes, efficacité opérationnelle accrue, voire création de nouvelles lignes de revenus. Rajan Padmanabhan, responsable technologique chez Infosys, insiste sur la nécessité de relier chaque initiative IA à des indicateurs business précis, plutôt que de traiter ces projets comme des expérimentations isolées. Les entreprises les plus avancées utilisent des cadres de gouvernance pour identifier rapidement ce qui produit des résultats concrets et abandonner ce qui n'en produit pas, une discipline que peu d'organisations ont encore intégrée dans leur fonctionnement quotidien. Cette transformation s'inscrit dans un changement de paradigme plus profond. Pendant des décennies, les systèmes d'information ont été conçus comme des outils d'exécution ou d'engagement. Padmanabhan décrit une nouvelle logique en train d'émerger : "des systèmes d'action", capables de décider et d'agir de manière autonome. C'est précisément la promesse des agents IA, qui évoluent de simples assistants vers des opérateurs autonomes gérant des flux de travail et des transactions entières. Mais cette évolution suppose que les données sous-jacentes soient fiables, accessibles et gouvernées, une condition que la plupart des grandes entreprises ne remplissent pas encore. La question n'est donc plus de savoir si l'IA va transformer l'entreprise, mais si les organisations sauront construire l'infrastructure de données nécessaire avant que la fenêtre d'opportunité ne se referme sur celles qui auront avancé plus vite.

InfrastructureOpinion
1 source
4NVIDIA AI Blog 

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Les centres de données d'entreprise sont en train de vivre une mutation profonde : autrefois dédiés au stockage et au traitement de données, ils deviennent des usines à tokens, dont la production principale est l'intelligence artificielle générée à la demande. Cette transformation oblige les entreprises à repenser entièrement leur manière d'évaluer le coût total de possession (TCO) de leur infrastructure IA. Or, selon NVIDIA, la majorité des décideurs continuent de se focaliser sur des métriques obsolètes : le coût par GPU par heure ou les FLOPS par dollar, c'est-à-dire la puissance brute de calcul obtenue pour chaque dollar investi. Ces indicateurs mesurent des intrants, alors que les entreprises, elles, font tourner leur activité sur des extrants. La seule métrique qui compte réellement est le coût par million de tokens produits, soit le coût tout compris pour générer chaque unité d'intelligence délivrée à l'utilisateur final. Optimiser ce coût par token change fondamentalement l'équation économique de l'IA. Le numérateur de cette équation, le coût horaire du GPU, est visible et facile à comparer entre fournisseurs cloud ou solutions on-premise. Mais c'est le dénominateur, soit le volume de tokens effectivement délivrés par seconde, qui détermine la rentabilité réelle. Augmenter ce débit produit deux effets simultanés : il réduit le coût unitaire de chaque interaction servie, améliorant ainsi les marges, et il augmente le nombre de tokens par mégawatt consommé, ce qui permet de générer davantage de revenus à partir du même investissement infrastructurel. NVIDIA affirme proposer le coût par token le plus bas du secteur, notamment sur les modèles de raisonnement de type mixture-of-experts (MoE), qui représentent aujourd'hui la catégorie de modèles la plus largement déployée en production. Cette réévaluation des critères de choix s'inscrit dans un contexte de montée en puissance de l'IA agentique, où les systèmes autonomes enchaînent des séquences longues d'inférences, rendant le débit et la latence encore plus critiques. Des technologies comme le décodage spéculatif, la prédiction multi-token, le routage KV-aware ou encore le déchargement du cache KV permettent d'augmenter substantiellement le débit réel sans changer le matériel. La prise en charge de la précision FP4, la capacité de l'interconnexion à gérer le trafic all-to-all des modèles MoE, ou encore les optimisations de la couche de serving deviennent des critères de sélection déterminants. Pour les déploiements on-premise notamment, où l'engagement en capital sur le foncier, l'énergie et l'infrastructure est massif, maximiser l'intelligence produite par mégawatt n'est plus une option technique mais un impératif économique.

InfrastructureActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic