Aller au contenu principal

Souveraineté IA· sujet

195 articlesmis à jour le 2026-05-06

La bataille pour la souveraineté IA : Mistral, OVHcloud Dragon LLM, infrastructure souveraine européenne et alternatives au cloud américain.

Hub d'actualité sur Souveraineté IA, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

La souveraineté IA est passée en 2026 du discours politique à l'investissement industriel concret. Mistral lève 830 millions de dollars pour son premier centre de données français. La même semaine, 722 millions d'euros pour 13 800 GPU NVIDIA. La France choisit AMD pour une partie de son infrastructure. Le Cohere canadien rachète Aleph Alpha allemand. Verda (ex-DataCrunch) construit la première Gigafactory GPU européenne.

L'enjeu juridique est clair. Le Cloud Act américain de 2018 rend toutes les données traitées sur AWS, Azure ou GCP accessibles à la justice américaine, même si les serveurs sont hébergés en Europe. Pour les administrations, les startups B2B sensibles aux données, les laboratoires de recherche, ce n'est pas un détail — c'est un avantage juridique structurant qui justifie l'investissement souverain.

Pourquoi Souveraineté IA compte

La souveraineté IA compte parce que c'est le contre-pouvoir industriel à la concentration GAFA + Anthropic. Pas une posture politique : un investissement infrastructure tangible qui se chiffre en milliards d'euros. Mistral, OVHcloud, Verda, Cohere/Aleph Alpha forment l'écosystème européen agentique 2026 — sous-dimensionné face aux capitaux américains, mais en croissance accélérée.

L'autre angle : la souveraineté n'est plus seulement européenne. La Chine a démontré avec DeepSeek V4 + Huawei Ascend qu'on peut faire frontière sous embargo. Les pays du Golfe investissent dans leur propre IA. L'Inde construit BharatGPT. La fragmentation du marché IA mondial s'accélère, et le levier réglementaire européen (DMA, AI Act) devient un outil concurrentiel concret pour Mistral et consorts.

Chronologie

  1. Juin 2018Cloud Act américain : toutes les données traitées sur infrastructure US juridiction américaine
  2. 2019-2024GAIA-X européen : initiative annoncée mais qui finit en comité de pilotage, peu d'infrastructure concrète
  3. Avr 2025OVHcloud rachète Dragon LLM (consolidation européenne sur le LLM)
  4. 27 mar 2026Mistral AI lance Voxtral, modèle français qui surpasse ElevenLabs (open-weight)
  5. 30 mar 2026Mistral AI sécurise 830 M$ en dette pour son premier centre de données français
  6. 30 mar 2026Mistral réunit 722 M€ supplémentaires pour 13 800 GPU NVIDIA
  7. 17 avr 2026IA et souveraineté : la France choisit AMD pour une partie de son infrastructure
  8. 27 avr 2026Cohere (canadien) rachète Aleph Alpha (allemand) : consolidation transatlantique
  9. 5 mai 2026Ruben Bryon (Verda / ex-DataCrunch) construit la première Gigafactory GPU européenne
  10. 5 mai 2026Voxtral comble le fossé d'expressivité dans le clonage vocal multilingue (l'open-weight souverain bat le propriétaire américain)

Cinq articles essentiels

Sélection éditoriale. Ces cinq pièces couvrent les angles les plus utiles pour comprendre Souveraineté IA en 2026.

  1. Ruben Bryon construit une alternative européenne au cloud américain : la Gigafactory GPU comme acte concret de souveraineté.

  2. Mistral lève 830 M$ pour son premier centre de données français : la stratégie infrastructure souveraine prend forme.

  3. Mistral 722 M€ pour 13 800 GPU NVIDIA : la deuxième jambe de l'investissement matériel souverain.

  4. Cohere rachète Aleph Alpha : consolidation transatlantique du marché souverain hors-GAFA.

  5. La France choisit AMD pour son infrastructure IA : diversification matérielle au-delà de NVIDIA.

  6. Mistral Voxtral surpasse ElevenLabs en open-weight : preuve que l'écosystème souverain peut produire du frontière.

Analyses long-form sur Souveraineté IA

Quand un sujet mérite un format long, c'est ici.

Questions fréquentes

Qu'est-ce que la souveraineté IA ?

Capacité d'un État, d'une entreprise ou d'une institution à utiliser de l'IA sans dépendance critique à des fournisseurs étrangers (modèles, infrastructure, données). Inclut : modèles entraînés localement, datacenters sur sol national, données qui ne quittent pas la juridiction. En Europe, c'est généralement défini par opposition au Cloud Act américain.

Pourquoi le Cloud Act est-il un problème ?

Loi US de 2018 qui oblige les entreprises américaines à transmettre les données stockées sur leurs serveurs aux autorités US, même si ces serveurs sont à l'étranger. Concrètement : toutes les données dans AWS, Azure, GCP — y compris en Europe — peuvent être consultées par la justice américaine. Pour les données sensibles (santé, défense, financier), c'est un risque juridique structurel.

Quels sont les acteurs souverains européens en 2026 ?

Modèles : Mistral AI (frontière, France), Cohere/Aleph Alpha (Canada-Allemagne après acquisition), HuggingFace (open-weight). Infrastructure : OVHcloud, Scaleway, Verda (Gigafactory). Plateforme : projet GAIA-X (mou), Bleu (gouvernement français), Plateforme S3NS (Thales x Google). Hardware : la France diversifie vers AMD ; Mistral reste structurellement NVIDIA-dépendante.

La souveraineté IA est-elle vraiment atteignable face aux GAFA ?

Sur le frontière pur de capacité, l'écart capitaux est massif (OpenAI 830 Md$ valuation, Anthropic 60-80 Md$ post-deals, Mistral ~6-8 Md$). Sur la trajectoire infrastructure + open-weight + levier réglementaire (DMA), l'écosystème souverain européen progresse. La souveraineté en 2026 est partielle (juridique forte, industrielle modérée) — pas binaire.

Toute l'actualité Souveraineté IA

Flux automatique. Articles classés par pertinence, agrégés en continu.

Dell et OpenAI lancent Codex en version on-premise pour les entreprises
1Le Big Data OutilsOpinion

Dell et OpenAI lancent Codex en version on-premise pour les entreprises

OpenAI et Dell Technologies ont annoncé le 18 mai 2026 un partenariat stratégique visant à déployer Codex, l'agent de développement logiciel d'OpenAI, directement dans les infrastructures sur site et hybrides des grandes entreprises. Concrètement, Codex sera connecté à la Dell AI Data Platform, la couche de stockage et de gouvernance de données que de nombreuses organisations utilisent pour gérer leurs actifs numériques en interne. Ce déploiement permettra aux agents IA d'accéder aux bases de code internes, à la documentation technique et aux workflows métiers sans que les données sensibles ne quittent l'infrastructure de l'entreprise. Codex compte aujourd'hui plus de 4 millions de développeurs actifs chaque semaine, ce qui en fait l'un des produits professionnels à la croissance la plus rapide du portefeuille OpenAI. Au-delà de l'assistance au développement logiciel, les entreprises l'utilisent déjà pour automatiser des revues de code, améliorer la couverture de tests, gérer des incidents techniques, générer des rapports ou encore router des feedbacks produits. Ce partenariat lève un frein majeur à l'adoption de l'IA générative dans les grandes organisations : la résistance à exposer des données sensibles vers le cloud public. Les secteurs de la finance, de la santé, de l'industrie et des infrastructures critiques maintiennent des architectures hybrides précisément pour conserver le contrôle total sur leurs actifs stratégiques. En permettant à Codex d'opérer au plus proche de ces données, OpenAI et Dell répondent directement aux contraintes de sécurité, de conformité réglementaire et de gouvernance qui bloquaient jusqu'ici les déploiements à grande échelle. Pour les équipes techniques, cela signifie concrètement pouvoir intégrer des agents IA dans des workflows critiques sans compromis sur la souveraineté des données. Ce mouvement s'inscrit dans une tendance de fond : après la phase d'expérimentation, le marché de l'IA en entreprise entre dans une phase de déploiement industriel. OpenAI, qui a longtemps été perçu comme un acteur cloud-first, cherche à ne pas perdre les grands comptes au profit de solutions souveraines ou de modèles open source déployables en local. Dell, de son côté, repositionne son infrastructure AI Factory comme une couche d'intégration incontournable entre les modèles fondateurs et les systèmes d'information d'entreprise. Le partenariat entre les deux groupes illustre une recomposition plus large du marché, où les fournisseurs de matériel et de cloud hybride deviennent des intermédiaires stratégiques pour l'adoption de l'IA dans les environnements réglementés. Les prochains mois diront si ce modèle de distribution peut convaincre les secteurs les plus prudents à franchir le pas.

UELes entreprises françaises et européennes des secteurs régulés (finance, santé, industrie) peuvent désormais envisager d'intégrer Codex dans leurs infrastructures on-premise sans exposer leurs données au cloud public, levant un frein majeur à l'adoption de l'IA générative dans des environnements soumis au RGPD et aux exigences de souveraineté numérique.

1 source
Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI
2FrenchWeb 

Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI

Mistral AI, la startup parisienne fondée en 2023 et valorisée plus de six milliards d'euros, annonce l'acquisition d'Emmi AI, une société spécialisée dans les agents conversationnels d'entreprise. Cette opération s'inscrit dans une stratégie de diversification accélérée : plutôt que de se limiter à l'entraînement de modèles fondationnels, Mistral cherche à construire une offre verticalement intégrée, allant du modèle de base jusqu'aux applications déployées chez les clients. Les détails financiers de l'acquisition n'ont pas été rendus publics. L'enjeu est de taille pour l'écosystème européen. Les entreprises du continent restent largement dépendantes des hyperscalers américains (AWS, Azure, Google Cloud) pour leurs infrastructures, des GPU NVIDIA pour le calcul, et des modèles d'OpenAI, Anthropic ou Google pour l'inférence. En absorbant Emmi AI, Mistral tente de proposer une alternative souveraine complète aux directions informatiques européennes soucieuses de leur autonomie stratégique et de conformité réglementaire, notamment au regard de l'AI Act européen entré en vigueur en 2024. Ce rachat intervient alors que la compétition internationale s'intensifie sur deux fronts simultanés : les États-Unis maintiennent leur avance sur les modèles de pointe, tandis que la Chine rattrape son retard à marche forcée avec des architectures intégrées comme celles de Huawei ou Baidu. Pour Mistral, qui a levé 1,1 milliard de dollars en 2024 avec des investisseurs comme Andreessen Horowitz et la Banque publique d'investissement, l'heure est au passage à l'échelle commerciale, pas seulement technologique.

UEL'acquisition d'Emmi AI par Mistral AI renforce l'offre souveraine européenne en agents IA d'entreprise, donnant aux DSI françaises et européennes une alternative intégrée aux solutions américaines, dans un contexte de conformité à l'AI Act.

💬 Mistral fait le pari qu'un modèle de base, ça ne suffit plus. Racheter Emmi AI, c'est aller chercher le client là où il est, dans ses workflows d'entreprise, plutôt que d'attendre qu'il vienne lui-même sur une API. Reste à voir si une startup, même avec un milliard en caisse, peut tenir tête aux hyperscalers sur leur propre terrain.

BusinessOpinion
1 source
Le PDG de Mistral, Arthur Mensch, met en garde la France contre l'analyse de bases de code militaires par Mythos d'Anthropic
3The Decoder 

Le PDG de Mistral, Arthur Mensch, met en garde la France contre l'analyse de bases de code militaires par Mythos d'Anthropic

Arthur Mensch, PDG et cofondateur de Mistral AI, a lancé un avertissement public contre l'utilisation de modèles d'intelligence artificielle américains pour analyser les bases de code militaires françaises. Ciblant explicitement Mythos, le modèle développé par Anthropic, Mensch a déclaré que confier des infrastructures sensibles de l'État français à des systèmes d'IA étrangers représente un risque inacceptable pour la souveraineté nationale. Ces déclarations interviennent alors que plusieurs gouvernements européens explorent l'intégration d'outils d'IA dans leurs processus de développement logiciel, y compris dans des contextes de défense. L'enjeu soulevé par Mensch dépasse la simple rivalité commerciale : il reconnaît ouvertement que les modèles d'IA modernes, y compris ceux de Mistral, sont désormais capables d'orchestrer des cyberattaques et de suggérer des failles exploitables dans un code source. Autoriser un modèle étranger à scanner des bases de code militaires revient donc à exposer potentiellement des vulnérabilités stratégiques à des acteurs hors du contrôle européen. Cette position illustre la tension croissante entre l'adoption rapide de l'IA dans les institutions publiques et les impératifs de cybersécurité nationale. Mistral, fondée en 2023 à Paris, s'est imposée comme le principal champion européen de l'IA générative face aux géants américains. Dans ce contexte, Mensch a également fermé la porte à toute hypothèse de rachat de l'entreprise, confirmant que Mistral vise une introduction en bourse. Cette sortie publique positionne Mistral comme un acteur engagé dans le débat sur la souveraineté technologique européenne, à l'heure où Bruxelles cherche à réduire sa dépendance aux infrastructures numériques américaines.

UELe PDG de Mistral alerte directement les institutions françaises contre l'utilisation d'IA américaine sur les bases de code militaires, soulevant des enjeux concrets de souveraineté numérique et de cybersécurité pour la défense nationale.

💬 Mensch dit tout haut ce que tout le monde sait : un LLM qui lit du code militaire, c'est aussi un LLM qui peut y repérer des failles. Pas besoin d'intention malveillante, suffit que les données de fine-tuning ou les logs partent au mauvais endroit. Bon, il a évidemment un intérêt commercial à jouer la carte souveraineté, mais là-dessus, il a quand même raison.

SécuritéOpinion
1 source
Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents
4Next INpact 

Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents

Mistral AI travaille au développement d'un modèle d'intelligence artificielle dédié à la détection de failles de sécurité dans le code de banques européennes, selon des informations rapportées par Bloomberg. La startup française, qui collaborait déjà avec ses clients du secteur bancaire sur ces problématiques avant le lancement de Mythos par Anthropic en avril dernier, prépare désormais une version "clé en main" pour un déploiement plus large. En parallèle, Microsoft a dévoilé MDASH, pour "Microsoft Security multi-model agentic scanning harness", un système de sécurité agentique mobilisant plusieurs modèles d'IA complémentaires et une centaine d'agents spécialisés. Sur le benchmark CyberGym, qui regroupe plus de 1 500 tâches reproduisant des vulnérabilités réelles, MDASH affiche un taux de réussite de 88,45 %, soit environ 5 points de mieux que son concurrent le plus proche. Le système a déjà permis d'identifier 16 vulnérabilités dans l'authentification et l'infrastructure réseau de Windows, dont 4 failles critiques permettant l'exécution de code à distance. La détection automatisée de vulnérabilités par IA est en train de passer du statut d'expérimentation de laboratoire à celui d'outil industriel déployé à grande échelle, c'est le constat que Microsoft formule explicitement. Pour les entreprises et institutions gérant des infrastructures critiques, l'enjeu est considérable : des systèmes capables d'ausculter des millions de lignes de code en continu représentent un saut qualitatif majeur face aux audits manuels. Mais cette puissance soulève aussi une question de dépendance stratégique : qui contrôle ces outils, et sur quel code s'appliquent-ils ? C'est précisément ce point qu'Arthur Mensch, directeur général de Mistral, a soulevé cette semaine devant la commission d'enquête sur les vulnérabilités numériques à l'Assemblée nationale. Sans nommer Anthropic, il a pointé le risque de confier le code et les bases de données de l'armée française à un modèle étranger comme Mythos, actuellement distribué au compte-gouttes auprès d'organisations majoritairement américaines, sans accès accordé à l'Europe. L'argument est limpide : la cybersécurité par IA est un sujet régalien, et la souveraineté technologique devient un critère non négociable. Mistral se positionne ainsi comme alternative européenne crédible dans une course qui oppose déjà Anthropic, OpenAI avec son initiative Daybreak, et désormais Microsoft. La question des certifications, des audits et de la gouvernance de ces outils devrait rapidement s'imposer dans les débats réglementaires européens.

UEMistral AI développe un modèle de cybersécurité souverain ciblant les banques européennes et les infrastructures militaires françaises, tandis qu'Arthur Mensch alerte l'Assemblée nationale sur le risque stratégique de confier le code de l'armée française à des modèles américains sans accès garanti à l'Europe.

💬 Ce que dit Mensch à l'Assemblée, c'est pas du lobbying habillé en souveraineté, c'est du bon sens brut : si tu confies le code de l'armée française à un modèle américain qui filtre lui-même ses accès européens, tu perds la main sur ta propre infrastructure critique. Microsoft affiche 88% sur CyberGym et 4 failles critiques trouvées dans Windows, le niveau monte vite. Mistral a l'argument souveraineté, reste à voir si ça pèse face à des chiffres pareils.

SécuritéOpinion
1 source
La souveraineté en matière d'IA et de données à l'ère des systèmes autonomes
5MIT Technology Review 

La souveraineté en matière d'IA et de données à l'ère des systèmes autonomes

Face aux risques croissants liés à la dépendance aux grandes plateformes d'intelligence artificielle, un mouvement de fond s'organise au sein des entreprises mondiales. Selon une enquête menée par EDB auprès de plus de 2 050 cadres dirigeants, 70 % d'entre eux estiment désormais avoir besoin d'une plateforme souveraine de données et d'IA pour rester compétitifs. Kevin Dallas, PDG d'EDB, résume le problème central : lorsqu'une entreprise déploie une application propulsée par un grand modèle de langage hébergé dans le cloud, elle risque de perdre sa propriété intellectuelle et son avantage concurrentiel, car ses données transitent par des systèmes qu'elle ne contrôle pas, soumis à des politiques qui peuvent changer à tout moment. En janvier 2026, Jensen Huang, PDG de Nvidia, a enfoncé le clou lors du Forum économique mondial de Davos, en appelant chaque pays à bâtir sa propre infrastructure d'IA, à exploiter sa langue et sa culture comme ressources naturelles, et à intégrer une intelligence nationale dans son écosystème technologique. L'enjeu dépasse la simple prudence juridique. Pour de nombreuses organisations, les données constituent désormais le principal actif immatériel, l'équivalent d'un brevet ou d'un secret de fabrication. Confier ces données à des modèles tiers, c'est potentiellement alimenter les systèmes de concurrents ou s'exposer à des fuites lors de mises à jour de conditions d'utilisation. La souveraineté en matière d'IA, c'est-à-dire la capacité à héberger, entraîner et gouverner ses propres modèles ainsi que ses données, devient ainsi un impératif stratégique autant qu'une nécessité réglementaire, en particulier dans des secteurs comme la finance, la santé ou la défense, où la confidentialité des informations est non négociable. Ce virage s'inscrit dans une trajectoire plus longue. Depuis les premières expérimentations avec l'IA générative en entreprise, le pari implicite était d'accepter une perte partielle de contrôle en échange de gains de productivité rapides. Mais l'arrivée des systèmes agentiques, capables d'agir de façon autonome sur des processus métier critiques, a rendu ce compromis intenable pour beaucoup. Les entreprises réévaluent aujourd'hui les fondements de leur infrastructure IA, cherchant à rapatrier modèles et données dans des environnements qu'elles maîtrisent réellement. Ce rapport d'EDB, réalisé en partenariat avec MIT Technology Review Insights, dessine les contours d'un marché en pleine recomposition, où la souveraineté numérique cesse d'être un idéal politique pour devenir un critère concret de choix technologique.

UELes entreprises françaises et européennes des secteurs finance, santé et défense sont directement concernées par cet impératif de souveraineté numérique, que renforcent le RGPD et l'AI Act en imposant un contrôle strict des données et des modèles utilisés.

💬 Le truc qui change l'équation, c'est l'agentique. Tant que l'IA résumait des emails, on pouvait fermer les yeux sur où transitaient les données, mais dès qu'un agent autonome touche à tes processus métier critiques, la question du contrôle devient non-négociable. 70% des dirigeants qui réclament une infra souveraine, c'est pas de la paranoïa, c'est juste de la gestion de risque basique.

RégulationReglementation
1 source
SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP
6Le Big Data 

SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP

Lors de SAP Sapphire 2026, l'éditeur allemand SAP a présenté sa nouvelle vision stratégique : transformer son ERP en une "entreprise autonome" capable d'exécuter des processus critiques de bout en bout grâce à l'IA. Le CEO Christian Klein a dévoilé trois piliers majeurs : SAP Autonomous Suite, qui déploie plus de 50 assistants Joule spécialisés coordonnant plus de 200 agents IA dans la finance, les achats, la supply chain, les RH et l'expérience client ; SAP Business AI Platform, qui fusionne SAP Business Technology Platform, SAP Business Data Cloud et SAP Business AI en un environnement unique ; et Joule Work, une interface orientée objectif accessible sur ordinateur, mobile et commandes vocales. Pour accélérer l'adoption, SAP annonce un fonds de 100 millions d'euros et une série de partenariats avec Anthropic, Amazon Web Services, Google Cloud, Microsoft, NVIDIA, Mistral AI et Cohere. Un cas concret a été mis en avant avec l'énergéticien RWE : des agents IA analysent des milliers d'incidents passés sur des éoliennes offshore pour identifier l'origine probable d'une panne et générer automatiquement des ordres de maintenance préremplis. L'enjeu central de cette annonce est de faire passer l'IA d'un rôle d'assistant à celui d'exécutant autonome au coeur des opérations d'entreprise. L'assistant dédié à la clôture financière illustre l'ambition : en automatisant les écritures comptables, les rapprochements et la correction d'erreurs, SAP promet de réduire un processus qui prenait plusieurs semaines à quelques jours seulement. Pour les grandes entreprises soumises à des exigences croissantes de productivité, de conformité réglementaire et de rapidité, c'est une promesse directement chiffrée en gains opérationnels. Le lancement de sept solutions Industry AI, avec des règles métiers et réglementaires propres à chaque secteur, signale que SAP ne vise plus seulement les directions IT mais les métiers eux-mêmes, qu'il s'agisse de l'énergie, de la logistique ou de la fabrication. Cette offensive s'inscrit dans une compétition frontale entre les grands éditeurs ERP pour la domination de l'IA d'entreprise, face à Oracle, Microsoft et Salesforce qui poursuivent des ambitions similaires. SAP capitalise sur sa position de référence dans les grandes organisations mondiales, où ses systèmes gèrent déjà les données les plus critiques : c'est précisément ce capital de confiance et de données que le groupe cherche à monétiser via l'IA autonome. Le SAP Knowledge Graph, couche qui structure les relations entre données, processus et entités métiers, est présenté comme le socle différenciateur qui donnera aux agents une compréhension contextuelle que des solutions génériques ne peuvent pas offrir. Les partenariats avec des fournisseurs de modèles souverains comme Mistral AI et Cohere indiquent également que SAP anticipe des exigences de conformité et de localisation des données, particulièrement fortes en Europe. La prochaine étape sera de valider ces promesses à grande échelle dans des déploiements réels, au-delà des cas pilotes présentés en conférence.

UESAP, leader européen des ERP, intègre Mistral AI dans sa plateforme et anticipe explicitement les exigences européennes de souveraineté et de localisation des données, avec un fonds de 100 millions d'euros ciblant l'adoption dans les grandes organisations, dont de nombreuses entreprises françaises et européennes déjà clientes.

💬 Les 50 assistants et les 200 agents, c'est du bruit. Ce qui compte, c'est le Knowledge Graph, cette couche qui structure 30 ans de données métiers dans des millions d'entreprises, et que personne d'autre ne peut reproduire du jour au lendemain. Le cas RWE sur les éoliennes, bon, c'est encore un pilote, mais c'est exactement là où SAP peut devenir difficile à contourner.

OutilsOutil
1 source
Claude devient beaucoup plus accessible : AWS ouvre toute la plateforme IA d’Anthropic
7Le Big Data 

Claude devient beaucoup plus accessible : AWS ouvre toute la plateforme IA d’Anthropic

Anthropic a annoncé ce 11 mai 2026 que l'intégralité de sa plateforme Claude est désormais accessible directement depuis Amazon Web Services, sous forme de disponibilité générale. Concrètement, les clients AWS peuvent désormais utiliser l'ensemble des fonctionnalités de l'API Claude, Claude Managed Agents pour déployer des agents IA à grande échelle, exécution de code Python via API, recherche web intégrée, et un système de Skills permettant à Claude d'apprendre des comportements ou méthodes de travail spécifiques, sans quitter leur environnement cloud habituel. L'intégration couvre l'authentification IAM, la facturation unifiée AWS, les audits via CloudTrail, et un accès immédiat aux nouvelles fonctionnalités au fil de leur sortie. Jusqu'ici, plusieurs capacités avancées de Claude restaient réservées à l'API native d'Anthropic. Pour les équipes techniques en entreprise, le gain est avant tout opérationnel : plus besoin de gérer des systèmes parallèles de connexion, de facturation ou de permissions. Cette simplification réduit la friction à l'adoption et abaisse la barrière d'entrée pour les organisations déjà investies dans AWS. Anthropic précise toutefois que le traitement des données sur cette plateforme s'effectue en dehors de l'infrastructure AWS classique, une nuance importante pour les entreprises soumises à des contraintes strictes de souveraineté ou de conformité. Pour celles-là, Anthropic maintient une offre distincte via Amazon Bedrock, où AWS reste l'opérateur principal et les données demeurent dans l'infrastructure Amazon, deux positionnements qui ciblent deux profils d'entreprises différents. Cette annonce s'inscrit dans une bataille industrielle plus large où les plateformes cloud sont devenues les principales portes d'entrée de l'IA générative. OpenAI pousse ChatGPT Enterprise, Google multiplie les intégrations Gemini dans son écosystème, Microsoft verrouille ses capacités IA dans Azure, et Anthropic devait muscler son jeu pour ne pas rester un fournisseur de modèles sans ancrage infrastructure. Le partenariat entre Anthropic et Amazon, qui s'est matérialisé par un investissement massif d'Amazon dans Anthropic ces dernières années, trouve ici une nouvelle expression concrète. En intégrant Claude profondément dans AWS, Anthropic gagne en distribution et en crédibilité enterprise, tandis qu'Amazon renforce l'attractivité de son cloud pour les projets IA. La prochaine étape sera de voir si cette intégration accélère effectivement l'adoption de Claude dans les grandes organisations, ou si la question non résolue de la localisation des données freinera les déploiements dans les secteurs les plus régulés.

UELes entreprises européennes sur AWS peuvent désormais accéder à l'ensemble de la plateforme Claude sans friction opérationnelle, mais le traitement des données hors infrastructure AWS standard soulève des questions de conformité pour les secteurs soumis aux exigences de souveraineté numérique de l'UE.

OutilsOpinion
1 source
☕️ Bruxelles obtient un accès à GPT-5.5-Cyber, mais ça bloque toujours avec Mythos
8Next INpact 

☕️ Bruxelles obtient un accès à GPT-5.5-Cyber, mais ça bloque toujours avec Mythos

La Commission européenne a officiellement obtenu un accès à GPT-5.5-Cyber, le modèle de langage d'OpenAI dédié à la cybersécurité, disponible depuis le 7 mai 2026 en accès limité pour les organisations chargées de sécuriser les infrastructures critiques. Thomas Regnier, porte-parole de la Commission pour la souveraineté technologique, a salué « la transparence d'OpenAI et sa volonté de donner à la Commission un accès à son nouveau modèle », précisant que cela permettrait de « suivre de très près le déploiement » du modèle et de traiter certaines préoccupations de sécurité. C'est OpenAI qui a fait le premier pas en contactant directement Bruxelles. La Commission doit maintenant définir quelles entités internes pourront travailler concrètement avec le modèle : parmi les candidates figurent la DG Connect, l'AI Office et l'agence de cybersécurité ENISA. Côté Anthropic, les discussions pour un accès à Mythos, le modèle le plus ambitieux de la société, se poursuivent après quatre ou cinq réunions, mais restent loin du niveau atteint avec OpenAI. Cet accès revêt une importance stratégique pour l'Union européenne, qui cherche à ne pas rester à l'écart des outils d'IA les plus avancés dans un domaine aussi sensible que la cybersécurité. George Osborne, responsable d'OpenAI for Countries, a insisté sur le fait que les capacités de GPT-5.5-Cyber devaient être « accessibles aux nombreux défenseurs européens, et pas seulement à quelques-uns ». La Commission obtient ainsi un levier d'analyse directe sur un modèle dont les usages touchent aux infrastructures critiques du continent, ce qui lui permettra de mieux évaluer les risques et les conformités réglementaires avant tout déploiement élargi. L'absence d'accès équivalent à Mythos, en revanche, crée un angle mort notable : Bruxelles se retrouve en position d'observateur partiel face à l'offre d'Anthropic, dont le modèle est présenté comme particulièrement puissant. Ce mouvement s'inscrit dans la stratégie globale d'OpenAI baptisée « OpenAI for Countries », lancée pour tisser des partenariats institutionnels avec les gouvernements à l'échelle mondiale, et dont un plan d'action spécifique pour la cybersécurité en Europe a déjà été annoncé. Le programme TAC (Trusted Access for Cyber) d'OpenAI, élargi en avril avec GPT-5.4-Cyber, conditionne l'accès à une vérification préalable des partenaires, ce qui place la Commission dans un cercle restreint de confiance. Cette dynamique révèle une compétition croissante entre les grands laboratoires américains pour gagner la confiance des institutions européennes, à l'heure où l'AI Act impose de nouvelles obligations de transparence. Si Anthropic ne parvient pas à trouver un terrain d'accord similaire avec Bruxelles, Mythos risque de faire face à un accueil réglementaire plus difficile sur le marché européen que son rival d'OpenAI.

UELa Commission européenne dispose d'un accès direct à GPT-5.5-Cyber pour évaluer les risques sur les infrastructures critiques et vérifier la conformité à l'AI Act, tandis que l'absence d'accord similaire avec Anthropic pour Mythos crée un angle mort réglementaire potentiellement défavorable à ce modèle sur le marché européen.

💬 Ce qui se joue là, c'est pas de la conformité réglementaire, c'est de la conquête de territoire. OpenAI a fait le premier pas vers Bruxelles, a décroché l'accès, et se retrouve dans le cercle de confiance de la Commission avant que l'AI Act soit pleinement appliqué. Anthropic, après cinq réunions sans avancée sur Mythos, part avec un désavantage qui risque de coûter cher.

RégulationReglementation
1 source
Dans l’IA, la Chine bouscule son monde avec sa stratégie open source
9Next INpact 

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source

Depuis fin avril 2026, deux modèles chinois occupent le sommet du classement des LLM les plus utilisés sur Open Router, la principale place de marché mondiale pour les modèles de langage : Hy3 de Tencent, fort de 295 milliards de paramètres, et Kimi K2.6 de la start-up pékinoise Moonshot AI, fondée en 2023. Claude Sonnet 4.6 et Claude Opus 4.7 d'Anthropic n'arrivent qu'en troisième et quatrième position, suivis de plusieurs versions de DeepSeek et de Gemini. Ce palmarès n'est pas un accident : la Chine a déposé 70 % des 54 000 brevets mondiaux en IA générative, et Alibaba revendiquait en mars un milliard de téléchargements cumulés pour sa famille Qwen, représentant plus de la moitié des téléchargements mondiaux de modèles open source. Kimi, lui, est accessible à environ 4 dollars le million de tokens générés, soit six à huit fois moins cher que GPT-5.5 ou Claude Opus 4.7. Cet avantage tarifaire peut sembler négligeable pour un utilisateur individuel, mais il change radicalement l'équation pour les entreprises qui font tourner des centaines d'agents d'IA en parallèle. En rendant publics des modèles performants à faible coût, les acteurs chinois attaquent la chaîne de valeur que les géants américains ont bâtie autour de leurs APIs propriétaires. Le gouvernement de Singapour a illustré cette dynamique en novembre dernier en abandonnant Llama de Meta au profit de Qwen pour construire son modèle d'IA souverain, tandis que Taobao et Tmall intègrent déjà ces outils dans leurs services quotidiens. Pour les directions informatiques du monde entier, l'open source chinois est désormais une alternative sérieuse, pas un choix par défaut. Cette offensive s'inscrit dans un contexte de restrictions américaines sur l'accès aux semi-conducteurs avancés, qui ont contraint la Chine à optimiser ses modèles pour des architectures matérielles moins récentes. Résultat : des systèmes plus légers, moins gourmands, et moins coûteux à l'usage. La déflagration DeepSeek, dès début 2025, avait été le premier signal fort de cette capacité d'adaptation, au point d'inquiéter Jensen Huang, le patron de Nvidia. La quatrième version de DeepSeek, conçue pour fonctionner exclusivement sur des technologies chinoises avec le soutien de Huawei, a confirmé la tendance. En mars, Anthropic a formellement dénoncé l'utilisation de comptes frauduleux par DeepSeek, Moonshot et MiniMax pour extraire massivement les capacités de Claude. Loin de la seule rivalité technologique, cette stratégie open source représente une évolution des Nouvelles Routes de la Soie vers un levier d'influence numérique mondial, où la dépendance aux modèles chinois pourrait progressivement supplanter celle aux infrastructures occidentales.

UELa domination chinoise sur l'open source IA place l'Europe face à un arbitrage stratégique entre adoption de modèles performants et bon marché et risque de substitution d'une dépendance américaine par une dépendance chinoise, en tension directe avec les objectifs de souveraineté numérique de l'UE.

💬 Quatre dollars le million de tokens contre vingt-cinq pour Claude Opus, c'est là que le débat se joue maintenant. Quand tu fais tourner des centaines d'agents en parallèle, la facture n'est plus la même, et les DSI ont sorti leurs calculettes. Ce que personne n'avait vraiment anticipé: les restrictions américaines sur les puces ont finalement produit des modèles plus légers, moins gourmands, et difficiles à contrer sur le prix.

LLMsOpinion
1 source
AI Act : l’Union européenne accorde un répit aux industriels
10Next INpact 

AI Act : l’Union européenne accorde un répit aux industriels

Le Parlement européen et le Conseil de l'UE ont conclu le 7 mai 2026 un accord sur l'omnibus numérique proposé par la Commission européenne, qui modifie en profondeur le calendrier de l'AI Act. Les systèmes d'IA déployés dans des domaines à haut risque, biométrie, infrastructures critiques, éducation, emploi, contrôle aux frontières ou encore migration, ne seront soumis aux nouvelles obligations qu'à compter du 2 décembre 2027, soit seize mois de délai supplémentaire par rapport à l'échéance initiale du 2 août 2026. Pour les systèmes embarqués dans des produits grand public comme des jouets ou des ascenseurs, la date limite est repoussée au 2 août 2028. En parallèle, l'accord assouplit la charge administrative : les avantages jusque-là réservés aux PME s'étendent aux entreprises de taille intermédiaire, des « bacs à sable » réglementaires permettront de tester les solutions avant mise sur le marché, et les doublons avec d'autres législations européennes sur la sécurité des produits ont été clarifiés. En revanche, les protections contre les deepfakes non consensuels sont renforcées : les systèmes IA générant du contenu sexuel explicite sans consentement ou des images sexualisées d'enfants seront interdits à la commercialisation, avec une mise en conformité requise avant le 2 décembre 2026. Ces reports ne sont pas anodins pour les entreprises technologiques européennes qui peinaient à absorber la complexité réglementaire de l'AI Act tout en restant compétitives face à des acteurs américains et chinois évoluant dans des cadres nettement plus permissifs. Pour les industriels, le délai supplémentaire représente une fenêtre concrète pour adapter leurs systèmes, former leurs équipes et attendre que les normes techniques d'accompagnement soient effectivement disponibles, un point que la Commission reconnaît explicitement. La vice-présidente Henna Virkkunen, chargée de la Souveraineté technologique, a présenté l'accord comme un équilibre entre innovation et sécurité, un discours qui tranche avec les critiques de certaines organisations de surveillance des lobbies, qui dès le début de l'année dénonçaient l'influence d'« oligarques de la tech » sur le processus législatif. La pression industrielle sur Bruxelles était intense : le 4 mai, quatre jours seulement avant l'accord, Airbus, Mistral AI, Nokia et ASML avaient co-signé une lettre ouverte déplorant des règles « étouffantes, inutilement complexes et souvent redondantes ». L'AI Act, entré en application en février 2025 avec l'ambition de définir un standard mondial pour une IA digne de confiance, se retrouve ainsi confronté à la même tension que le RGPD en son temps : entre l'ambition normative européenne et les contraintes pratiques d'une industrie qui ne veut pas perdre le rythme face à la concurrence internationale. Les prochains mois diront si ces aménagements suffisent à réconcilier les deux camps, ou si de nouveaux reculs se profilent.

UELes entreprises françaises et européennes bénéficient de seize mois supplémentaires pour mettre en conformité leurs systèmes IA à haut risque avec l'AI Act, un délai directement réclamé par Mistral AI et Airbus dans une lettre ouverte du 4 mai 2026.

💬 Seize mois de délai, c'est l'aveu que le calendrier était irréaliste. Mistral et Airbus n'avaient pas tort de sonner l'alarme, pas sur le principe mais sur le rythme : mettre des équipes en conformité avec des normes techniques qui n'existent pas encore, c'est juste impossible. La fermeté sur les deepfakes non consensuels au 2 décembre 2026 sauve un peu la mise.

RégulationReglementation
1 source
DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise
11Le Big Data 

DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise

DeepSeek, le laboratoire d'intelligence artificielle chinois fondé par Liang Wenfeng, serait en négociation pour boucler sa première levée de fonds externe, d'un montant compris entre 3 et 4 milliards de dollars, à une valorisation pouvant atteindre 50 milliards de dollars. L'information, révélée en premier par le Financial Times puis confirmée par le Wall Street Journal, place DeepSeek parmi les startups d'IA les plus valorisées au monde. Le fonds national chinois dédié à l'intelligence artificielle, doté de 60 milliards de yuans, serait en discussions pour mener l'opération, avec Tencent également présent dans les négociations. Jusqu'à présent, DeepSeek fonctionnait de façon quasi autonome, financée principalement par High-Flyer, le hedge fund de son fondateur, qui conserve environ 89,5 % du capital via ses participations personnelles et affiliées. Cette levée de fonds marque un tournant stratégique pour DeepSeek. Les capitaux recherchés visent à renforcer les infrastructures de calcul de la société et à améliorer les conditions offertes à ses ingénieurs, dans un contexte de compétition féroce pour attirer les talents. Le développement des agents IA, qui exécutent des tâches complexes avec une intervention humaine réduite, exige désormais une puissance de calcul nettement supérieure à celle des chatbots classiques, ce qui se traduit par des coûts en GPU, datacenters et recrutement considérablement plus élevés. Pour rester dans la course face à ByteDance, Alibaba, MiniMax ou Moonshot AI, DeepSeek ne peut plus se permettre de fonctionner en dehors des circuits d'investissement institutionnels. Le succès viral des modèles V3 et R1 de DeepSeek début 2025 avait provoqué un choc sur les marchés technologiques mondiaux, en démontrant qu'il était possible d'atteindre des performances comparables à celles d'OpenAI ou d'Anthropic à une fraction du coût, grâce à une approche open source radicale. Pékin avait alors perçu dans la startup un potentiel champion national capable de rivaliser avec les géants américains dans la course à l'IA générale. L'intérêt du fonds souverain pour cette opération confirme que l'État chinois entend désormais consolider son soutien aux laboratoires les plus prometteurs, réduisant ainsi sa dépendance technologique vis-à-vis des États-Unis dans un domaine jugé stratégique. DeepSeek doit cependant confirmer cette trajectoire sur le plan technique : son nouveau modèle V4, présenté comme redéfinissant l'état de l'art open source pour les agents IA, fait l'objet d'évaluations indépendantes mitigées, certains analystes estimant qu'il reste en retrait face aux meilleurs modèles concurrents.

UELa montée en puissance de DeepSeek, soutenue par des fonds souverains chinois, intensifie la compétition mondiale en IA et fragilise la position des acteurs européens face à deux blocs (US/Chine) disposant désormais de ressources d'investissement massives.

💬 Ce qui m'intéresse, c'est pas la valorisation à 50 milliards. C'est que DeepSeek, le labo qui nous avait sorti V3 et R1 en mode "regardez ce qu'on fait avec trois fois rien", doit maintenant aller chercher de l'argent à l'État pour rester dans la course. Le modèle "on fait mieux moins cher" a ses limites dès qu'on passe aux agents IA, et V4 fait pas l'unanimité non plus, donc on est un peu à 50 milliards sur une promesse pas encore tenue.

BusinessActu
1 source
Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare
12Next INpact 

Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare

Des utilisateurs de Google Chrome ont découvert sur leurs machines un fichier baptisé weights.bin, pesant jusqu'à 4 gigaoctets, téléchargé sans la moindre notification ni demande de consentement. Ce fichier est stocké dans un dossier nommé OptGuideOnDeviceModel, accessible sous Windows dans AppData\Local\Google\Chrome\User Data\Default\ et sous macOS dans ~/Library/Application Support/Google/Chrome/Default/. Les premiers signalements remontent à mi-2025, mais le sujet a resurgi le 4 mai 2026 avec la publication d'une analyse détaillée par Alexander Hanff, consultant en sécurité connu sous le pseudonyme ThatPrivacyGuy. Selon ses observations, Chrome télécharge ce fichier dans les quinze minutes suivant l'ouverture du navigateur, et le recrée automatiquement à chaque lancement s'il a été supprimé manuellement. Le phénomène n'est pas universel : les auteurs de l'article source n'ont trouvé aucune trace du fichier sur quatre machines testées sous Windows et macOS. L'absence totale d'information de la part de Google constitue le cœur du problème. Occuper 4 gigaoctets sur le disque d'un utilisateur sans explication ni possibilité simple de refus représente une atteinte directe à la maîtrise que chacun devrait avoir sur son propre matériel. Alexander Hanff va plus loin : il estime que ce comportement contrevient à la directive européenne e-Privacy de 2002, qui encadre précisément les accès aux ressources des terminaux des utilisateurs. Il réclame de Google une communication claire sur la nature du fichier, l'adoption d'un mécanisme d'opt-in exigeant un consentement préalable, et la possibilité de supprimer définitivement ce contenu. L'impact n'est pas seulement individuel : le consultant tente également d'évaluer l'empreinte environnementale de ces téléchargements répétés sur des centaines de millions d'appareils, même si ce calcul reste hautement spéculatif. Ce fichier n'est pourtant pas totalement opaque sur le plan technique. Il correspond à l'intégration de Gemini Nano, le modèle d'intelligence artificielle embarqué de Google, directement dans Chrome, une démarche documentée publiquement depuis fin 2024. Ces poids de modèle servent à alimenter des fonctionnalités comme la détection automatique de langue ou d'autres outils d'IA locale dans le navigateur. Google n'a pas encore réagi publiquement à la controverse. L'affaire s'inscrit dans un contexte plus large de déploiement silencieux de fonctions d'IA par les grands éditeurs : Alexander Hanff avait récemment épinglé Claude Desktop d'Anthropic pour un comportement similaire, pré-autorisant ses extensions de navigateur sans en informer l'utilisateur. La pression réglementaire européenne et la sensibilité croissante du public sur la souveraineté numérique rendent ce type de pratique de plus en plus difficile à maintenir sans déclencher de réaction.

UELe comportement de Chrome pourrait enfreindre la directive e-Privacy européenne de 2002, exposant Google à des recours réglementaires pour dépôt de fichiers sur les terminaux d'utilisateurs européens sans consentement préalable.

💬 4 Go sans demander, n'importe quelle startup se ferait retourner pour ça. Le fichier en lui-même n'est pas mystérieux, c'est Gemini Nano, documenté depuis fin 2024, mais déposer ça silencieusement sur des centaines de millions de machines sans opt-in, ça ne tient pas face à l'e-Privacy. Reste à voir ce que ça va coûter à Google au niveau réglementaire.

ÉthiqueReglementation
1 source
Ruben BRYON, construire une alternative européenne au cloud américain
13FrenchWeb 

Ruben BRYON, construire une alternative européenne au cloud américain

Ruben Bryon a commencé à coder seul à l'âge de 12 ans, allant jusqu'à percer un mur dans le garage familial pour refroidir ses premiers serveurs. Quinze ans plus tard, il dirige Verda, une entreprise fondée sous le nom de DataCrunch, qui ambitionne de construire la première "Gigafactory" européenne de l'intelligence artificielle. Concrètement, il s'agit de déployer des centres de données massivement équipés en GPU, les puces indispensables à l'entraînement et à l'inférence des grands modèles d'IA, sur le sol européen, en dehors de la dépendance aux hyperscalers américains comme AWS, Azure ou Google Cloud. L'enjeu est considérable pour l'industrie technologique européenne. Les startups et laboratoires de recherche du continent paient aujourd'hui leurs coûts de calcul à des entreprises américaines, ce qui crée une dépendance structurelle tant sur le plan économique que réglementaire. Une infrastructure GPU souveraine permettrait aux acteurs européens de développer et déployer des modèles d'IA sans que leurs données transitent par des juridictions soumises au droit américain, un point particulièrement sensible depuis le Cloud Act de 2018. L'initiative de Bryon s'inscrit dans un mouvement plus large de souveraineté numérique européenne, porté aussi bien par des régulations comme le RGPD que par des initiatives industrielles telles que GAIA-X. Face à la concentration du marché du cloud d'IA entre les mains de quelques géants américains, des acteurs comme Verda cherchent à occuper le créneau de l'infrastructure de confiance en Europe, à mesure que la demande en puissance de calcul pour l'IA continue d'exploser.

UEVerda déploie des centres de données GPU sur sol européen pour permettre aux startups et laboratoires de recherche européens d'entraîner leurs modèles d'IA sans transiter par des juridictions soumises au Cloud Act américain.

💬 C'est exactement ce qu'on attendait depuis que le Cloud Act a rendu la question brûlante. Partir de l'infra GPU, pas du cadre réglementaire, c'est ce qui distingue Verda de toutes les initiatives européennes de souveraineté numérique qui finissent en comité de pilotage. Reste à voir si les capitaux suivent à l'échelle d'une gigafactory.

InfrastructureOpinion
1 source
SAP cherche à bloquer OpenClaw et les autres agents IA non autorisés
14The Information AI 

SAP cherche à bloquer OpenClaw et les autres agents IA non autorisés

SAP, le géant allemand des logiciels d'entreprise valorisé à 200 milliards de dollars, a publié le mois dernier un document de politique interne avertissant ses clients qu'il pourrait leur interdire d'utiliser des agents d'intelligence artificielle externes pour accéder aux données stockées dans ses applications, sans validation officielle de l'entreprise. Le document ne cible pas nommément d'outils spécifiques, mais la restriction s'appliquerait aussi bien aux agents développés par des concurrents comme Salesforce et ServiceNow qu'à des outils tiers comme OpenClaw. Cette décision illustre une tension croissante dans l'écosystème des logiciels d'entreprise : les éditeurs historiques craignent que leurs clients ne court-circuitent leurs propres offres d'IA en s'appuyant sur des agents externes pour interroger des données sensibles. Pour SAP, l'enjeu est double : préserver le contrôle sur son infrastructure et s'assurer que l'accès aux données passe par ses propres outils certifiés, vraisemblablement contre rémunération ou dans le cadre de contrats encadrés. Cette démarche s'inscrit dans un contexte plus large où les agents IA autonomes commencent à s'imposer dans les workflows d'entreprise, soulevant des questions de sécurité, de conformité et de souveraineté des données. Contrairement à d'autres éditeurs qui adoptent une posture plus ouverte face à l'interopérabilité, SAP choisit de poser des barrières dès maintenant, avant que l'usage de ces agents ne devienne incontrôlable. La réaction des clients et des acteurs tiers comme OpenClaw reste à observer, mais le signal envoyé par un acteur de cette taille pourrait faire école dans le secteur.

UESAP étant une entreprise allemande dont les logiciels sont massivement déployés dans les grandes entreprises françaises et européennes, cette politique pourrait contraindre les DSI à renoncer aux agents IA tiers et à n'utiliser que les solutions certifiées SAP.

💬 SAP ne fait pas ça pour la sécurité, enfin pas que. Ils protègent leur futur chiffre d'affaires IA, c'est aussi simple que ça. La vraie question c'est si les DSI vont accepter que leur éditeur ERP décide à leur place quels agents ont le droit d'exister dans leurs workflows.

BusinessOpinion
1 source
Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU
15Next INpact 

Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU

La Chine vient de révéler, sans aucune communication officielle, l'existence d'un supercalculateur exascale baptisé LineShine, hébergé au Centre National de Supercalcul de Shenzhen (NSCC-SZ). La machine atteint une puissance théorique de 2,47 ExaFLOPS, dont 1,2 ExaFLOPS ont été effectivement mesurés lors de son utilisation pour entraîner un modèle de type MLIP (Machine Learning Interatomic Potentials), soit à peine un quart de sa capacité maximale. LineShine embarque 12,4 millions de cœurs de calcul et 1 310 téraoctets de mémoire HBM. Ce qui frappe immédiatement les observateurs : cette architecture est entièrement scalaire, sans aucun GPU. L'information n'est pas venue d'un communiqué de presse mais d'une publication scientifique parue il y a deux semaines, repérée et relayée par Stéphane Requena, directeur technique du Genci (Grand Équipement National de Calcul Intensif), sur LinkedIn. Si LineShine était soumis au classement Top500, référence mondiale des supercalculateurs, il se retrouverait au coude à coude avec El Capitan, le numéro un mondial actuellement en service aux États-Unis. L'enjeu dépasse la performance brute : ce supercalculateur démontre que la Chine est capable de construire des infrastructures de calcul de premier rang mondial sans dépendre des GPU haute performance de NVIDIA, dont l'exportation vers la Chine est soumise à embargo américain. L'absence de GPU dans une machine de cette envergure représente un choix architectural délibéré et une réponse technologique directe aux restrictions imposées par Washington. Pour les acteurs de l'IA et de la simulation scientifique, c'est la preuve que les restrictions d'exportation n'ont pas bloqué la montée en puissance chinoise, mais l'ont orientée vers des solutions souveraines. La Chine ne participe plus au Top500 depuis plusieurs années, dans un contexte de tensions croissantes avec les États-Unis autour des technologies stratégiques. Depuis les premières vagues de sanctions, Pékin a systématiquement développé ses propres alternatives matérielles et logicielles, tout en maintenant le silence sur ses capacités réelles. LineShine s'inscrit dans cette logique d'autonomie technologique assumée : les avancées chinoises en supercalcul se découvrent désormais à travers des publications académiques, non par des annonces officielles. Les prochains mois pourraient révéler d'autres systèmes de cette génération, alors que la course au calcul exascale s'accélère aussi bien pour la simulation climatique, la recherche pharmaceutique que pour l'entraînement de modèles d'intelligence artificielle de grande taille.

UELa découverte a été relayée par Stéphane Requena, directeur technique du GENCI (institution française de calcul intensif), signalant que les sanctions américaines n'ont pas freiné la montée en puissance chinoise, un avertissement stratégique pour la souveraineté technologique européenne en matière d'infrastructure HPC.

💬 2,47 ExaFLOPS sans un seul GPU, et on l'apprend par une publication académique, pas un communiqué de presse. L'embargo américain n'a pas freiné la Chine, il l'a juste orientée vers ses propres solutions, et visiblement ça tient la route. Ce qui devrait vraiment inquiéter l'Europe, c'est qu'on ne sait pas combien d'autres machines comme ça existent déjà.

InfrastructureOpinion
1 source
FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois
16Le Big Data 

FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois

L'équipe Qwen d'Alibaba a présenté le 29 avril 2026 FlashQLA, une bibliothèque de noyaux d'attention linéaire haute performance construite sur TileLang, un langage de programmation optimisé pour le calcul parallèle. Les chiffres avancés sont nets : la propagation avant des modèles est accélérée de 2 à 3 fois, tandis que la rétropropagation, phase critique de l'entraînement, voit sa vitesse pratiquement doubler. L'architecture repose sur une division des calculs en deux noyaux distincts plutôt qu'un bloc unifié, ce qui se traduit par une légère surcharge mémoire mais des performances réelles supérieures sur machines modestes. La rétropropagation bénéficie en particulier d'un pipeline en 16 étapes optimisé au niveau du warp avec des contraintes mémoire très faibles. Ce qui distingue FlashQLA des solutions concurrentes est sa cible explicite : les appareils personnels et l'edge computing, pas les data centers. Alibaba positionne cet outil pour faire tourner des modèles d'IA agentielle directement sur des ordinateurs portables et machines locales, réduisant la dépendance aux serveurs cloud. Les gains sont particulièrement marqués pour les petits modèles et les tâches à contexte long, deux cas d'usage centraux pour l'IA embarquée. Pour les développeurs et les entreprises qui déploient des agents IA en production, cela signifie des coûts d'inférence réduits, des latences plus faibles et une meilleure utilisation de la mémoire sans changement de matériel. FlashQLA s'inscrit dans une tendance de fond qui traverse l'ensemble de l'industrie depuis 2024 : la course à l'efficacité des modèles en dehors du cloud. Face à des coûts d'inférence toujours élevés et à des préoccupations croissantes autour de la souveraineté des données, les grandes entreprises technologiques cherchent à rapprocher la puissance de calcul de l'utilisateur final. Alibaba, via son équipe Qwen déjà connue pour ses modèles ouverts compétitifs face à GPT-4, renforce ici sa position dans l'écosystème open source en proposant une brique d'optimisation bas niveau directement utilisable par la communauté. La publication fait suite à plusieurs annonces similaires dans l'industrie, dont FlashAttention de Tri Dao ou les optimisations kernel de Meta pour Llama. Si FlashQLA tient ses promesses à l'échelle, il pourrait accélérer la migration d'une partie des charges d'inférence vers le local, rééquilibrant durablement le rapport entre cloud centralisé et calcul distribué.

UEL'axe edge computing et réduction de dépendance au cloud s'aligne indirectement avec les objectifs de souveraineté numérique européenne, mais aucun impact direct sur la France ou l'UE n'est identifiable.

InfrastructureOpinion
1 source
Les risques cachés dans le financement de l'IA
17The Information AI 

Les risques cachés dans le financement de l'IA

Lors d'une conférence intitulée "Financing the AI Revolution" organisée lundi, des investisseurs et banquiers spécialisés dans l'IA ont été interrogés sur les risques cachés du marché actuel. Après un silence gêné, Martin Fichtner, responsable des investissements technologiques pour le fonds souverain singapourien Temasek, basé à San Francisco, a évoqué la "dérivée seconde" de la demande : non pas un ralentissement de la croissance, mais un simple fléchissement de son accélération suffirait à inquiéter les marchés. Son confrère Jim Prusko, gestionnaire de portefeuille senior chez Magnetar, a de son côté cité le risque réglementaire et les pressions politiques croissantes contre les centres de données américains comme menaces concrètes au déploiement de l'infrastructure IA. Magnetar est l'un des principaux soutiens financiers de CoreWeave, développeur de data centers, dont le vice-président au développement Nick Robbins reconnaît lui-même une tension permanente entre l'offre et la demande, notant que l'entreprise "ne peut pas lever des capitaux assez vite pour suivre la demande." Ces risques ne sont pas théoriques : deux scénarios se déroulent déjà sous les yeux des investisseurs. Anthropic a récemment relevé ses tarifs à un niveau tel que les coûts pour certains clients pourraient doubler, voire tripler selon certaines estimations. Dans un contexte où de nombreuses entreprises n'ont pas encore mesuré de gains concrets liés à l'IA, cette hausse fragilise leur appétit pour des dépenses importantes. Parallèlement, The Information rapporte chez OpenAI des objectifs manqués, une instabilité au niveau de la direction et une croissance décevante, une série de révélations qui a suffi à faire chuter les cours en bourse d'Oracle et de CoreWeave, deux acteurs ayant parié massivement sur la croissance de l'entreprise. L'enthousiasme reste néanmoins dominant : des dizaines de milliards de dollars ont afflué vers des acteurs comme Anthropic et OpenAI, portés par l'amélioration spectaculaire des modèles et une demande commerciale en forte hausse. Des introductions en bourse sont attendues pour ces deux sociétés ainsi que pour SpaceX. Mais l'histoire des booms technologiques enseigne que les investisseurs ont tendance à anticiper la réalité. Le vrai risque n'est pas l'éclatement d'une bulle, mais les déséquilibres ponctuels inhérents à toute ruée vers une technologie de rupture : lorsque l'offre finira par dépasser la demande chez certains opérateurs très endettés comme CoreWeave et ses concurrents, la correction pourrait être sévère pour les entreprises concernées et leurs créanciers. Les signaux d'alerte existent, même si peu d'investisseurs sont prêts à les nommer publiquement.

UELes hausses de tarifs d'Anthropic et les risques de correction du marché de l'infrastructure IA pourraient renchérir le coût des solutions IA pour les entreprises européennes et freiner leur adoption.

BusinessOpinion
1 source
Comment les Workflows de Mistral AI transforment l’IA en moteur opérationnel ?
18Le Big Data 

Comment les Workflows de Mistral AI transforment l’IA en moteur opérationnel ?

Mistral AI a lancé une fonctionnalité baptisée Workflows, intégrée à sa plateforme Studio, qui vise à résoudre l'un des problèmes les plus documentés de l'IA en entreprise : moins de 20 % des projets d'IA atteignent réellement la production. La startup française propose une couche d'orchestration permettant de passer d'un prototype à un déploiement opérationnel en quelques jours. Techniquement, la solution s'appuie sur le moteur Temporal, déjà adopté par des entreprises comme Salesforce, Netflix ou Stripe, mais adapté aux contraintes spécifiques de l'IA générative : gestion du streaming, mutualisation des ressources, traçage des exécutions et reprise automatique en cas d'erreur. Le modèle de déploiement sépare le plan de contrôle, hébergé par Mistral, du plan de données, qui reste dans l'environnement de l'entreprise via Kubernetes. Des acteurs comme CMA-CGM et La Banque Postale figurent parmi les premiers déploiements concrets. L'enjeu est majeur pour les équipes techniques qui, jusqu'ici, devaient assembler elles-mêmes agents, connecteurs, outils d'observabilité et gestion des erreurs à partir de briques hétérogènes, mobilisant parfois des mois de développement avant d'atteindre une version stable. Les Workflows de Mistral proposent un cadre unifié où ces composants fonctionnent ensemble dès le départ. Le SDK simplifie la configuration des politiques de reprise, des délais d'attente et de la gestion des erreurs en quelques lignes de Python, ce qui permet aux développeurs de se concentrer sur la logique métier plutôt que sur l'infrastructure. L'intégration avec Le Chat permet également aux équipes non techniques d'exécuter ces workflows sans friction, ce qui réduit la fracture habituelle entre développeurs et utilisateurs métiers. Ce lancement s'inscrit dans une compétition accélérée entre fournisseurs de modèles qui cherchent à monter dans la chaîne de valeur, au-delà de la simple inférence. OpenAI, Google et Anthropic investissent tous dans des couches d'orchestration et d'agents, mais Mistral joue une carte différente : la souveraineté des données et le déploiement en environnement contrôlé, un argument central pour les entreprises européennes soumises au RGPD et aux exigences sectorielles strictes du secteur financier ou logistique. En positionnant Workflows comme une infrastructure industrielle plutôt qu'un outil d'expérimentation, Mistral tente de s'imposer comme le partenaire de référence pour les grandes organisations qui ont besoin de garanties sur la fiabilité, l'observabilité et la conformité de leurs systèmes d'IA en production.

UELe lancement de Mistral Workflows renforce la position de cette startup française comme alternative souveraine pour les grandes organisations européennes soumises au RGPD, avec des premiers déploiements concrets chez CMA-CGM et La Banque Postale.

💬 Ce problème des 20% de projets IA qui n'atteignent jamais la prod, tout dev qui bosse en entreprise le connaît. Mistral n'a pas réinventé la roue : ils ont pris Temporal (déjà chez Netflix et Stripe) et l'ont adapté aux contraintes du génératif, ce qui évite de passer six mois à assembler soi-même des briques qui ne se parlent pas. L'argument souveraineté RGPD, c'est pas du flan quand tes premiers clients sont CMA-CGM et La Banque Postale.

OutilsOutil
1 source
Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents
19VentureBeat AI 

Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents

La startup américaine Poolside, fondée à San Francisco en 2023, a lancé ce 28 avril 2026 deux nouveaux modèles de langage sous la marque Laguna, conçus spécifiquement pour les tâches de codage agentique. Le premier, Laguna M.1, est un modèle propriétaire de 225 milliards de paramètres au format Mixture of Experts (MoE), avec 23 milliards de paramètres actifs, destiné aux environnements d'entreprise et gouvernementaux à hautes exigences de sécurité. Le second, Laguna XS.2, est un modèle open source sous licence Apache 2.0 de 33 milliards de paramètres (3 milliards actifs), téléchargeable et exécutable localement sur un simple GPU de bureau ou d'ordinateur portable, sans connexion internet. Poolside accompagne ces deux modèles d'un agent de codage en ligne de commande baptisé "pool" et d'un environnement de développement web mobile appelé "shimmer". Temporairement, même le plus grand modèle M.1 est accessible gratuitement via l'API Poolside et des partenaires comme OpenRouter, Ollama et Baseten. L'arrivée de Laguna XS.2 en open source représente un signal fort dans un secteur dominé soit par des modèles propriétaires coûteux comme Claude d'Anthropic ou GPT-5.5 d'OpenAI, soit par des modèles chinois à licence ouverte comme ceux de DeepSeek. Poolside offre ici une alternative américaine, exécutable entièrement hors ligne, ce qui répond à un besoin critique pour les agences gouvernementales et les entreprises opérant dans des environnements ultra-sécurisés. L'ingénieur post-entraînement George Grigorev a précisé que Poolside peut "livrer des poids dans des environnements totalement isolés on-premises, sans connexion réseau", un avantage décisif face aux solutions cloud d'Anthropic ou Google. Par ailleurs, les deux modèles Laguna ont été entraînés intégralement from scratch, contrairement à plusieurs laboratoires américains qui s'appuient sur les modèles de base Qwen d'Alibaba, ce qui leur confère une indépendance technique notable. Poolside s'est jusqu'ici concentrée sur des contrats gouvernementaux et de défense, construisant ses modèles dans un environnement interne appelé "Model Factory", dont le moteur central est un logiciel maison nommé Titan. L'entreprise utilise également un optimiseur d'entraînement appelé Muon, qui accélère l'apprentissage d'environ 15% par rapport aux méthodes standards, un avantage compétitif non négligeable en termes de coûts et de délais. En s'ouvrant maintenant à la communauté des développeurs et à la recherche publique, Poolside change de stratégie et entre de plein pied dans la bataille de l'open source agentique, à un moment où les entreprises tech cherchent à réduire leur dépendance aux API propriétaires pour des raisons de coût, de confidentialité et de souveraineté technologique.

UELes organisations européennes en environnement isolé (défense, administration) peuvent déployer localement un modèle de codage agentique open source américain sans dépendance cloud, renforçant leur autonomie technologique.

LLMsActu
1 source
La Chine bloque le rachat de Manus par Meta, sur fond de rivalité sino-américaine en IA
20Ars Technica AI 

La Chine bloque le rachat de Manus par Meta, sur fond de rivalité sino-américaine en IA

Le gouvernement chinois a officiellement ordonné à Meta de défaire son acquisition de la société d'intelligence artificielle Manus le 27 avril 2026, invoquant des raisons de sécurité nationale. Cette transaction, conclue en décembre 2025 pour un montant de 2 milliards de dollars, avait déjà été placée sous enquête dès janvier 2026, les autorités de Pékin ayant en parallèle interdit aux deux cofondateurs de Manus, des entrepreneurs technologiques chinois, de quitter le territoire national pendant la durée de l'investigation, selon le Wall Street Journal. La décision finale consacre l'interdiction totale des investissements étrangers dans Manus au nom de la sécurité nationale. Ce blocage illustre à quel point les transactions transfrontalières entre entreprises américaines et chinoises dans le domaine de l'IA sont devenues quasi impossibles à mener à terme. Des deux côtés du Pacifique, les autorités adoptent une ligne de plus en plus dure face aux opérations de fusion-acquisition impliquant des technologies sensibles. Pour Meta, il s'agit d'un revers stratégique majeur : l'entreprise perd l'accès à une technologie d'agents IA avancée et doit rembourser ou restructurer un investissement de deux milliards de dollars. Pour l'industrie, ce précédent envoie un signal clair sur les limites imposées aux partenariats sino-américains dans les secteurs jugés stratégiques. Manus avait fait son entrée remarquée en mars 2025 en se présentant comme un agent IA généraliste capable de réaliser des tâches complexes pour le compte des utilisateurs, comme rechercher un bien immobilier ou réserver des billets d'avion et des hôtels. Techniquement, le système fonctionne comme une surcouche agentique reposant sur le modèle Claude 3.7 Sonnet d'Anthropic, coordonnant plusieurs agents spécialisés, dont un agent planificateur et un agent exécuteur capable de naviguer sur des sites web, créer des tableurs et même développer des applications. Dans un contexte de rivalité technologique croissante entre Washington et Pékin, notamment sur les grands modèles de langage et les agents autonomes, cette affaire illustre comment l'IA est désormais traitée comme un enjeu de souveraineté nationale à part entière.

UELa rivalité sino-américaine en IA contraint les entreprises européennes à choisir leur camp et complique tout partenariat ou acquisition transfrontalière impliquant des acteurs des deux blocs.

💬 2 milliards pour récupérer rien du tout. Ce blocage était prévisible depuis que les deux blocs traitent l'IA comme de l'armement, mais ça fait quand même bizarre de voir Meta se faire éjecter par Pékin sur un agent qui tournait sous Claude. Les boîtes européennes feraient bien de prendre note avant de se retrouver coincées au milieu.

BusinessOpinion
1 source
Le canadien COHERE ouvre une porte en Europe avec l’acquisition d’ALEPH ALPHA
21FrenchWeb 

Le canadien COHERE ouvre une porte en Europe avec l’acquisition d’ALEPH ALPHA

Cohere, la société canadienne spécialisée dans les grands modèles de langage à destination des entreprises, a annoncé le rachat d'Aleph Alpha, la principale startup allemande d'intelligence artificielle. Cette acquisition marque une entrée directe de Cohere sur le marché européen, en absorbant ce qui était jusqu'ici la tentative la plus ambitieuse de l'Europe de construire un champion souverain de l'IA. L'opération bénéficie du soutien explicite de Berlin et d'Ottawa, ainsi que du groupe Schwarz, la holding derrière les enseignes Lidl et Kaufland, déjà investisseur historique d'Aleph Alpha. Ce rapprochement revêt une portée stratégique qui dépasse le simple mouvement commercial. En s'appropriant Aleph Alpha, Cohere accède à un réseau institutionnel européen dense, à des contrats avec des administrations publiques et à une crédibilité politique que peu d'acteurs nord-américains peuvent revendiquer sur le Vieux Continent. Pour les entreprises et gouvernements européens soucieux de diversifier leurs dépendances technologiques, cette entité combinée se positionne explicitement comme une alternative aux plateformes américaines comme OpenAI, Google ou Anthropic. Aleph Alpha avait été fondée en 2019 à Heidelberg avec l'ambition de doter l'Europe d'une IA souveraine, portée par des financements publics allemands et une rhétorique de la "souveraineté numérique". Malgré une levée de fonds significative et un soutien politique marqué, la startup peinait à rivaliser technologiquement avec les géants américains. Son absorption par Cohere soulève désormais des questions sur la viabilité d'une véritable indépendance européenne en IA, ou si cette alliance canado-européenne ne constitue qu'un compromis entre dépendance assumée et ambition souveraine.

UEL'acquisition d'Aleph Alpha par Cohere fragilise directement le projet de souveraineté numérique européenne en IA, contraignant les gouvernements et administrations de l'UE à reconsidérer leur stratégie de dépendance technologique.

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis
22Numerama 

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

DeepSeek vient de publier DeepSeek-V4-Preview, une famille de deux modèles open weight conçus pour rivaliser avec les meilleurs systèmes d'IA propriétaires américains. Le laboratoire chinois annonce un coût d'utilisation sept fois inférieur à celui de Claude Opus 4.7 d'Anthropic, ce qui en fait l'un des modèles les plus compétitifs du marché en termes de rapport performance-prix. Les poids sont accessibles librement, permettant à n'importe quelle entreprise ou développeur de les déployer sans dépendre des API américaines. L'impact est immédiat pour les équipes techniques et les entreprises qui cherchent à réduire leurs coûts d'inférence. Un modèle open weight de ce niveau de performance signifie qu'on peut l'héberger soi-même, adapter les poids, et s'affranchir des conditions d'utilisation imposées par OpenAI, Anthropic ou Google. Pour les marchés émergents et les entreprises européennes soucieuses de souveraineté numérique, c'est une alternative concrète aux géants américains. Ce lancement s'inscrit dans la continuité directe du coup de tonnerre de janvier 2025, lorsque DeepSeek-R1 avait provoqué un effondrement boursier des valeurs tech américaines en démontrant qu'on pouvait former des modèles de pointe à moindre coût. La Maison-Blanche surveille désormais de près les pratiques des laboratoires chinois, notamment sur les questions d'accès aux puces et de transfert technologique. Avec V4, DeepSeek confirme une stratégie délibérée : rendre l'open source suffisamment attractif pour décrocher les utilisateurs mondiaux des écosystèmes américains.

UELes entreprises européennes soucieuses de souveraineté numérique disposent d'une alternative open weight auto-hébergeable aux API américaines, réduisant leur dépendance aux conditions d'utilisation imposées par OpenAI, Anthropic ou Google.

💬 Sept fois moins cher que Claude Opus 4.7, open weight, que tu peux héberger toi-même sans dépendre d'une API américaine : on est loin du coup de com'. DeepSeek ne construit pas juste un modèle compétitif, ils construisent une porte de sortie pour toutes les boîtes qui en ont marre des conditions d'utilisation qui changent et des prix qui grimpent. Reste à tester si ça tient en prod.

LLMsOpinion
1 source
Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp
23FrenchWeb 

Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp

La Plateforme des données de santé a officiellement sélectionné Scaleway, filiale du groupe Iliad, pour héberger ses infrastructures, mettant fin à des années de dépendance vis-à-vis de Microsoft Azure. Ce choix, issu d'un appel d'offres rigoureux, éloigne les données médicales de millions de Français du spectre du Cloud Act américain et affirme un virage vers la souveraineté numérique. En parallèle, la startup UNIVITY annonce une levée de 27 millions d'euros pour déployer une infrastructure 5G spatiale combinant satellites et réseaux terrestres. Enfin, Devendra Chaplot, chercheur passé par Mistral AI, rejoint xAI, la société d'intelligence artificielle d'Elon Musk. Ces trois actualités convergent autour d'un même enjeu : la souveraineté technologique européenne. Le choix de Scaleway par le Health Data Hub répond aux alertes répétées de la CNIL sur les risques d'exposition des données de santé aux injonctions extraterritoriales américaines, et constitue un signal fort pour les opérateurs de cloud souverain français. L'investissement d'UNIVITY positionne l'Europe sur le marché de la connectivité satellitaire face à Starlink, tandis que le départ de Chaplot vers xAI illustre la capacité des mastodontes américains à capter les talents IA européens. La controverse autour du Health Data Hub remonte à 2020, quand le contrat Microsoft avait déclenché une vague de critiques de juristes et d'associations de défense des droits numériques. Scaleway, certifié hébergeur de données de santé (HDS), était depuis le candidat naturel à ce contrat stratégique. Plus largement, ces trois événements dessinent un écosystème européen en tension entre ambition souveraine et attraction irrésistible des géants américains de la tech.

UELe Health Data Hub migre de Microsoft Azure vers Scaleway (groupe Iliad), soustrayant les données médicales de millions de Français au Cloud Act américain, victoire directe pour la souveraineté numérique française et signal fort pour l'écosystème cloud souverain européen.

InfrastructureActu
1 source
NVIDIA et Google réduisent les coûts d'inférence en IA
24AI News 

NVIDIA et Google réduisent les coûts d'inférence en IA

Lors de la conférence Google Cloud Next, Google et NVIDIA ont dévoilé une nouvelle génération d'infrastructure destinée à réduire drastiquement le coût de l'inférence IA à grande échelle. Les deux entreprises ont présenté les instances A5X bare-metal, reposant sur les systèmes rack NVIDIA Vera Rubin NVL72. Cette architecture promet une réduction jusqu'à dix fois du coût d'inférence par token par rapport aux générations précédentes, tout en multipliant par dix le débit de tokens par mégawatt. Pour atteindre ces performances, les instances A5X combinent les SuperNICs NVIDIA ConnectX-9 avec la technologie réseau Google Virgo, permettant de connecter jusqu'à 80 000 GPU NVIDIA Rubin au sein d'un même site, et jusqu'à 960 000 GPU dans un déploiement multi-sites. Mark Lohmeyer, VP et directeur général de l'infrastructure IA chez Google Cloud, a résumé l'enjeu : "La prochaine décennie de l'IA sera façonnée par la capacité des entreprises à faire tourner leurs charges de travail les plus exigeantes sur une infrastructure vraiment intégrée et optimisée pour l'IA." Ces annonces ont un impact direct sur les secteurs fortement réglementés, comme la finance et la santé, qui butent régulièrement sur des contraintes de souveraineté des données. Google et NVIDIA y répondent avec plusieurs initiatives concrètes : les modèles Gemini fonctionnant sur GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en préversion sur Google Distributed Cloud, ce qui permet aux organisations de garder les modèles frontier entièrement dans leur environnement contrôlé, au plus près de leurs données sensibles. La sécurité est assurée par NVIDIA Confidential Computing, un protocole de chiffrement matériel qui protège les données d'entraînement et les prompts y compris vis-à-vis des opérateurs cloud eux-mêmes. Pour les environnements cloud public multi-tenant, des VM Confidential G4 équipées de GPU NVIDIA RTX PRO 6000 Blackwell sont également introduites en préversion, marquant la première offre de confidential computing cloud pour des GPU Blackwell. Cette collaboration s'inscrit dans une course plus large à l'optimisation de l'inférence, alors que les coûts opérationnels de l'IA générative restent un frein majeur à son adoption industrielle. Au-delà du matériel, le partenariat couvre aussi la couche logicielle : NVIDIA Nemotron 3 Super est désormais disponible sur la Gemini Enterprise Agent Platform, permettant aux développeurs de construire des systèmes agentiques complexes capables de raisonner, planifier et agir en chaîne. L'ensemble de la plateforme NVIDIA sur Google Cloud est optimisé pour les familles de modèles Gemini et Gemma. Avec des clusters dépassant le million de GPU et une ambition affichée de simplifier le déploiement d'IA souveraine, Google et NVIDIA repositionnent l'infrastructure cloud non plus comme un simple fournisseur de puissance de calcul, mais comme un levier stratégique pour les entreprises qui veulent industrialiser l'IA sans sacrifier performance, coût ou conformité réglementaire.

UELes entreprises européennes des secteurs réglementés (finance, santé) disposent désormais d'options d'infrastructure IA souveraine compatibles avec les exigences RGPD, réduisant un frein concret à l'industrialisation de l'IA en Europe.

InfrastructureActu
1 source
Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant
25VentureBeat AI 

Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant

Cirrascale Cloud Services a annoncé lors du Google Cloud Next 2026 à Las Vegas un accord élargi avec Google Cloud pour déployer le modèle Gemini en mode entièrement déconnecté, sur des serveurs physiques isolés d'internet. Cirrascale devient ainsi le premier fournisseur de cloud spécialisé à proposer le modèle phare de Google sous forme d'appliance privée, installée soit dans les centres de données de Cirrascale, soit directement dans les locaux du client. Le système repose sur un serveur certifié Google, fabriqué par Dell, équipé de huit GPU Nvidia et protégé par des mécanismes de calcul confidentiel. Une préversion est disponible immédiatement, avec une disponibilité générale attendue en juin ou juillet 2026. Dave Driggers, PDG de Cirrascale, a insisté sur un point clé : il s'agit du modèle Gemini complet, sans aucune restriction ni version allégée, déployé dans un environnement où les données d'entrée comme de sortie restent entièrement sous le contrôle du client. Fait notable sur le plan technique, les poids du modèle résident uniquement en mémoire volatile : dès que l'alimentation est coupée, le modèle disparaît sans laisser de trace persistante. Cette annonce répond à un problème structurel qui bloque depuis des années les secteurs régulés comme la finance, la santé, la défense et les administrations publiques. Ces organisations devaient jusqu'ici choisir entre accéder aux modèles les plus puissants via des API cloud publiques, au risque d'exposer leurs données sensibles à l'infrastructure d'un tiers, ou se contenter de modèles open source moins performants hébergés en interne. Le déploiement Cirrascale entend supprimer ce compromis. Driggers décrit l'escalade du problème de confiance : après les inquiétudes sur les données propriétaires confiées aux hyperscalers, les entreprises ont pris conscience que les prompts et les réponses générées étaient également récupérés par ces mêmes plateformes pour alimenter leurs propres systèmes, ce qui a rendu la demande de souveraineté totale incontournable. Cette évolution s'inscrit dans un mouvement plus large de migration des modèles d'IA frontier hors des centres de données des grands hyperscalers, vers les infrastructures propres des clients, ce qui représente une rupture avec la logique cloud dominante de la dernière décennie. Driggers distingue explicitement cette offre des déploiements on-premises proposés par Microsoft Azure avec les modèles OpenAI ou par AWS Outposts : dans ces cas, les modèles restent liés à l'infrastructure de leurs éditeurs. Ici, Google ne possède pas le matériel, et son modèle fonctionne en dehors de tout réseau Google. Pour le géant de Mountain View, accepter ce niveau de délégation sur son modèle le plus avancé traduit une stratégie commerciale claire : conquérir les marchés réglementés qui lui étaient jusqu'ici fermés, quitte à renoncer au contrôle direct de l'inférence.

UECe mode de déploiement air-gap répond directement aux exigences du RGPD et de l'AI Act en matière de souveraineté des données, ouvrant potentiellement Gemini aux administrations publiques, établissements de santé et institutions financières européennes soumis à des contraintes strictes de localisation et d'isolation des données.

💬 Le truc des poids uniquement en mémoire volatile, c'est la partie que je trouve la plus maligne. Parce que le blocage dans les secteurs régulés c'était pas juste "mes données sortent du réseau", c'était aussi "quelqu'un peut extraire ou copier le modèle", et là, coupe l'alimentation, ça disparaît. Google accepte de perdre le contrôle de l'inférence de son meilleur modèle pour aller chercher des marchés qui lui étaient fermés depuis des années. Ça, c'est un vrai mouvement.

InfrastructureOpinion
1 source
Le pari open source de la Chine
26MIT Technology Review 

Le pari open source de la Chine

Les laboratoires d'IA chinois ont adopté une stratégie radicalement différente de leurs rivaux américains : au lieu de monétiser leurs modèles derrière des API payantes, ils les publient en open-weight, c'est-à-dire sous forme de packages téléchargeables que n'importe quel développeur peut adapter et faire tourner sur ses propres serveurs. Ce tournant a pris une dimension mondiale en janvier 2025, lorsque DeepSeek a publié son modèle de raisonnement R1, qui a égalé les meilleures performances américaines à une fraction du coût annoncé. Dans la foulée, un véritable écosystème s'est structuré autour de ce modèle : Z.ai (anciennement Zhipu), Moonshot, Alibaba avec sa famille Qwen, et MiniMax ont tous suivi la même logique, en publiant des modèles de plus en plus capables. En août 2025, une étude menée par des chercheurs du MIT et de Hugging Face a établi que les modèles open-weight chinois représentaient 17,1 % des téléchargements mondiaux de modèles d'IA, dépassant pour la première fois la part américaine, fixée à 15,86 %. Les modèles Qwen d'Alibaba comptent aujourd'hui plus de variantes créées par des utilisateurs que ceux de Google et Meta réunis. L'impact de cette stratégie dépasse largement les benchmarks techniques. À mesure que l'enthousiasme autour de l'IA se tasse et que les entreprises passent des expérimentations aux déploiements concrets, les outils moins chers et plus personnalisables prennent l'avantage. Les modèles chinois permettent aux développeurs aux budgets limités d'expérimenter davantage, et le format open-weight leur donne la liberté d'adapter les modèles sans négocier de contrat commercial avec un acteur américain. Cette combinaison de prix bas et de liberté technique crée une adhérence forte : une fois qu'un écosystème se construit autour d'un modèle, comme l'ont montré Linux et Android, l'adoption se traduit naturellement en revenus API. Le Sud global, notamment Singapour, la Malaisie, le Kenya ou le Brésil, embrasse ouvertement ces outils, y voyant un chemin vers une souveraineté numérique. Derrière cette générosité apparente se cachent des calculs stratégiques précis. Sans accès aux puces de pointe bloquées par les contrôles à l'exportation américains, les laboratoires chinois compensent en ouvrant leurs modèles : plus les développeurs extérieurs contribuent et testent, plus vite le cycle d'amélioration s'accélère. Ce n'est pas sans tensions : en février 2026, Anthropic a accusé plusieurs laboratoires chinois de pratiques illicites de distillation, consistant à entraîner un nouveau modèle sur les sorties d'un autre. Les modèles chinois sont par ailleurs soumis aux exigences de censure du gouvernement de Pékin. Malgré ces limites, la dynamique est enclenchée : l'avenir de l'IA sera plus multipolaire que Silicon Valley ne l'anticipait, et rien ne semble pouvoir inverser cette tendance.

UELes modèles open-weight chinois offrent aux développeurs et entreprises européens une alternative concrète aux APIs américaines payantes, renforçant la souveraineté numérique de l'UE sans dépendance contractuelle envers les géants du Silicon Valley.

LLMsOpinion
1 source
Claude Code s'étend à toute l'organisation via Amazon Bedrock
27AWS ML Blog 

Claude Code s'étend à toute l'organisation via Amazon Bedrock

Anthropic et Amazon Web Services ont annoncé le lancement de Claude Cowork dans Amazon Bedrock, une intégration qui permet aux entreprises de déployer l'application de bureau Claude directement depuis leur infrastructure AWS. Concrètement, les utilisateurs téléchargent l'application Claude Desktop sur leur machine, puis le service informatique de l'entreprise pousse une configuration centralisée via des outils de gestion de parc comme Jamf, Microsoft Intune ou Group Policy. L'inférence est entièrement routée vers Amazon Bedrock dans les régions AWS choisies par l'organisation, sans licence par siège payée à Anthropic : la facturation est à la consommation, intégrée à l'accord AWS existant. L'application donne accès aux projets, artefacts, mémoire, import-export de fichiers, connecteurs distants et serveurs MCP. Les fonctionnalités nécessitant l'infrastructure Anthropic, onglet Chat, Computer Use, Skills Marketplace, sont exclues de cette offre. L'enjeu dépasse la seule productivité des développeurs. Claude Cowork vise à étendre l'adoption de l'IA à l'ensemble des travailleurs de la connaissance d'une organisation : chefs de produit, analystes, équipes juridiques ou RH peuvent déléguer de la recherche documentaire, de l'analyse de fichiers, de la génération de rapports, sans quitter leur environnement de travail habituel. Pour les entreprises soumises à des contraintes réglementaires strictes, l'argument central est la souveraineté des données : Amazon Bedrock ne stocke pas les prompts, fichiers, inputs ou outputs d'outils, ni les réponses du modèle, et ne les utilise pas pour entraîner des modèles fondamentaux. Les profils d'inférence régionaux, cross-régionaux ou globaux permettent de choisir le niveau de résidence des données adapté à chaque juridiction. Cette annonce s'inscrit dans une dynamique plus large de déploiement entreprise de l'IA générative, où les grands groupes cherchent à concilier puissance des modèles de pointe et exigences de conformité interne. AWS et Anthropic approfondissent ainsi un partenariat stratégique amorcé il y a plusieurs années, Amazon ayant investi plusieurs milliards de dollars dans Anthropic. Pour les organisations qui utilisent déjà Claude Code dans Bedrock pour leurs équipes techniques, la même configuration peut être réutilisée pour déployer Cowork. L'intégration avec IAM, VPC endpoints, CloudTrail et CloudWatch permet une gouvernance et une observabilité natives. La prochaine étape probable : étendre les capacités des serveurs MCP disponibles dans ce contexte géré, afin de connecter Claude aux systèmes métier internes sans compromettre l'isolation réseau.

UELes entreprises européennes soumises au RGPD peuvent déployer Claude à grande échelle via leurs régions AWS européennes, avec résidence des données garantie et sans que les prompts ou fichiers soient utilisés pour entraîner des modèles.

OutilsOutil
1 source
Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée
28Le Big Data 

Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée

Mozilla a officialisé le 16 avril 2026 le lancement de Thunderbolt, une interface d'IA conçue pour un déploiement entièrement auto-hébergé en entreprise. Développé par MZLA Technologies, la filiale responsable de Thunderbird, l'outil se positionne comme un "client d'IA souverain" capable de se connecter à des modèles existants, Claude, Codex, DeepSeek ou tout modèle open source, via des API compatibles OpenAI ou ACP. Il repose sur Haystack, un framework open source reconnu pour la construction de pipelines d'IA modulaires. Thunderbolt est disponible en applications natives sur Windows, macOS, Linux, iOS, Android et en version web, avec le code source React accessible sur GitHub. Un audit de sécurité est actuellement en cours avant une mise en production à grande échelle, et Mozilla encourage déjà les entreprises à explorer des déploiements sur site avec des licences adaptées. L'argument central de Thunderbolt est son architecture entièrement locale : les données restent sur l'infrastructure de l'entreprise, notamment via une base SQLite hors ligne, sans transit vers des services cloud externes. Le système intègre un chiffrement de bout en bout et des contrôles d'accès au niveau des appareils. Pour les organisations soumises au RGPD, aux réglementations sectorielles strictes, santé, finance, défense, ou qui manipulent des données sensibles, c'est un différenciateur décisif face aux offres de Microsoft, Google ou OpenAI qui centralisent tout. Thunderbolt prend en charge les usages devenus standards : chat, recherche, automatisation et workflows multi-appareils, ce qui limite la friction à l'adoption pour des équipes habituées aux outils IA grand public. Ce lancement s'inscrit dans une stratégie plus large que Mozilla a formulée dès novembre 2025 : "faire pour l'IA ce que nous avons fait pour le web", c'est-à-dire construire un écosystème ouvert et décentralisé face aux géants de la Big AI. Mozilla.ai, sa branche dédiée à l'IA open source, soutient en parallèle le développement d'outils et de modèles ouverts. Le pari de Mozilla est celui de l'interopérabilité contre l'enfermement propriétaire, la même philosophie qui a fondé Firefox contre Internet Explorer à l'époque. La demande pour des solutions souveraines ne cesse de croître en Europe notamment, portée par des impératifs réglementaires et une méfiance croissante envers la dépendance aux hyperscalers américains. Thunderbolt arrive donc au bon moment sur un marché B2B où la souveraineté technologique est devenue un critère d'achat à part entière, et non plus un simple argument marketing.

UEThunderbolt offre aux entreprises européennes soumises au RGPD et aux réglementations sectorielles (santé, finance, défense) une solution concrète pour déployer des workflows IA en conservant leurs données sur leur propre infrastructure, sans dépendance aux hyperscalers américains.

💬 Mozilla qui sort l'artillerie lourde sur la souveraineté IA, ça fait plaisir à voir. L'architecture tout-local avec SQLite hors ligne, l'audit sécu avant le lancement, la compatibilité OpenAI API pour brancher ses propres modèles, bon, sur le papier c'est exactement ce que les DSI européens réclamaient. Reste à voir si ça tient face aux besoins réels des grandes boîtes, parce qu'entre une démo GitHub propre et un déploiement santé à 5 000 users, il y a souvent un gouffre.

OutilsOutil
1 source
Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant
29FrenchWeb 

Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant

Sephora a annoncé fin mars à Las Vegas, lors de la conférence Shoptalk Spring, un partenariat stratégique avec OpenAI pour intégrer ChatGPT au cœur de son programme de fidélité Beauty Insider. Ce qui distingue cet accord de simples expérimentations marketing : l'enseigne confie à l'IA les données de ses membres, un actif considéré comme l'un des plus précieux de l'entreprise. Sephora inaugure ainsi ce que l'industrie commence à appeler le « shopping agentique », où l'IA ne se contente plus de répondre à des questions mais agit pour le compte de l'utilisateur. Pour les quelque 34 millions de membres Beauty Insider aux États-Unis, cela signifie potentiellement une expérience d'achat entièrement personnalisée, pilotée par un assistant capable d'analyser l'historique d'achats, les préférences de marques et les tendances beauté en temps réel. L'enjeu dépasse la simple recommandation produit : en laissant une IA accéder aux données comportementales de ses clients les plus fidèles, Sephora parie que la personnalisation de masse peut devenir un avantage concurrentiel durable face à la concurrence en ligne et aux plateformes comme Amazon. Ce partenariat s'inscrit dans une vague plus large de grands distributeurs qui cherchent à monétiser leurs données first-party à l'heure où les cookies tiers disparaissent. OpenAI, de son côté, accélère son virage vers les applications commerciales après avoir sécurisé des financements massifs, et le retail de luxe constitue un terrain d'expansion stratégique. La question qui reste ouverte est celle de la gouvernance : confier des données clients sensibles à un tiers comme OpenAI soulève des interrogations sur la souveraineté des données et la conformité au RGPD pour les opérations européennes de Sephora.

UESephora, entreprise française du groupe LVMH, confie des données clients sensibles à OpenAI, ce qui soulève des questions concrètes de conformité RGPD pour ses opérations européennes.

BusinessOpinion
1 source
30NVIDIA AI Blog 

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

NVIDIA et ses partenaires industriels investissent Hannover Messe 2026, le salon phare de l'industrie manufacturière qui se tient du 20 au 24 avril à Hanovre, en Allemagne, pour y présenter ce qu'ils considèrent comme la prochaine révolution de la production : l'usine pilotée par l'intelligence artificielle. Au programme, des démonstrations concrètes couvrant l'informatique accélérée, la simulation physique en temps réel, les agents autonomes et les robots humanoïdes opérant en environnement industriel. Parmi les temps forts, l'annonce de l'Industrial AI Cloud, l'un des plus grands centres d'IA d'Europe, construit en Allemagne par Deutsche Telekom sur infrastructure NVIDIA. Des géants comme SAP, Siemens, ABB, Dassault Systèmes, Cadence ou encore Synopsys y participent, aux côtés d'acteurs spécialisés comme Agile Robots, Wandelbots et PhysicsX. EDAG, prestataire indépendant d'ingénierie, a par ailleurs annoncé le déploiement de sa plateforme de métavers industriel "metys" sur ce cloud souverain, ciblant l'automobile et l'ingénierie lourde. L'enjeu est considérable : l'industrie manufacturière mondiale fait face à une pression simultanée sur les cycles de conception, les coûts opérationnels et la disponibilité de main-d'œuvre qualifiée. L'IA n'est plus une option expérimentale mais un levier de compétitivité immédiat. Les jumeaux numériques à l'échelle d'une usine entière, construits sur les bibliothèques Omniverse de NVIDIA et le standard ouvert OpenUSD, permettent désormais de simuler, tester et optimiser des lignes de production en continu, sans interruption physique. ABB, par exemple, intègre ces outils dans sa suite Genix pour analyser la performance des équipements et accélérer la recherche de causes de pannes via des agents IA. Pour les ingénieurs, la simulation physique en temps réel change radicalement le processus de conception : là où des heures de calcul étaient nécessaires, des résultats apparaissent en secondes. Cette offensive de NVIDIA dans l'industrie s'inscrit dans une stratégie plus large visant à faire de l'informatique accélérée le socle de la transformation industrielle européenne. Le concept de "souveraineté numérique" est central : face aux craintes européennes de dépendance aux clouds américains, l'Industrial AI Cloud positionné en Allemagne répond à une demande politique autant qu'économique. CUDA-X, Omniverse, les modèles ouverts Nemotron et les puces NVIDIA équipent désormais les logiciels des éditeurs les plus influents du secteur, de Siemens à Dassault Systèmes, créant un écosystème interdépendant difficile à contourner. Dell, IBM, Lenovo et PNY complètent l'offre avec des systèmes accélérés déployables de la périphérie jusqu'aux datacenters. La prochaine étape, déjà visible à Hanovre, est l'intégration de robots humanoïdes dans les chaînes de production, un marché où NVIDIA entend jouer un rôle d'infrastructure aussi structurant que dans l'IA générative.

UEL'Industrial AI Cloud inauguré en Allemagne par Deutsche Telekom sur infrastructure NVIDIA, avec la participation de Dassault Systèmes et Siemens, offre aux industriels européens une infrastructure cloud souveraine pour déployer l'IA en production.

InfrastructureActu
1 source
IA et souveraineté numérique : la France choisit AMD pour son infrastructure ?
31Le Big Data 

IA et souveraineté numérique : la France choisit AMD pour son infrastructure ?

La France a officialisé un partenariat pluriannuel avec AMD, le fabricant américain de semi-conducteurs, pour accélérer son infrastructure nationale en intelligence artificielle. L'accord a été signé au ministère de l'Économie et des Finances à Paris, en présence de trois ministres : Philippe Baptiste (Enseignement supérieur et Recherche), Sébastien Martin (Industrie) et Anne Le Hénanff (Numérique), ainsi que Keith Strier, vice-président senior d'AMD pour les marchés IA. Au coeur du dispositif figure le supercalculateur Alice Recoque, développé avec le GENCI, le CEA et le consortium Jules Verne, et dont la puissance visée atteint un exaflop, soit un milliard de milliards d'opérations par seconde. AMD fournira les briques technologiques aux côtés de Bull, désormais sous contrôle de l'État français, et un centre d'excellence sera chargé d'optimiser l'exploitation de cette infrastructure. Le partenariat inclut également un accès élargi aux programmes de formation du fabricant américain : AMD University Program, AMD AI Developer Program et AMD AI Academy. Ce partenariat représente une tentative concrète de combler le fossé entre excellence académique française et industrialisation de l'IA à grande échelle, un manque chroniquement identifié en Europe. En donnant aux chercheurs, start-up et ingénieurs français un accès direct aux technologies qui alimentent déjà les systèmes d'IA les plus avancés au monde, l'accord vise à accélérer le passage de la recherche au déploiement en production. L'infrastructure Alice Recoque ouvrira par ailleurs des capacités de calcul jusqu'ici inaccessibles à l'échelle nationale, couvrant des domaines aussi variés que la simulation climatique, la recherche scientifique avancée ou les applications à usage militaire. Elle alimentera aussi la future AI Factory France, destinée à structurer l'ensemble de la filière industrielle de l'IA dans le pays. Cette collaboration s'inscrit dans un contexte de course mondiale au calcul haute performance, où la France, comme le reste de l'Europe, peine à peser face aux États-Unis et à la Chine. Le choix d'AMD soulève néanmoins une question de fond sur la souveraineté numérique : peut-on revendiquer une autonomie stratégique en matière d'IA lorsque l'infrastructure repose sur un acteur américain ? La réalité industrielle laisse peu de marges de manoeuvre, les technologies de pointe en semi-conducteurs et en calcul étant aujourd'hui quasi exclusivement détenues par des entreprises non européennes. La France semble avoir arbitré en faveur de la performance immédiate, tout en espérant que cet écosystème d'excellence, de formation et de recherche posera les bases d'une plus grande autonomie technologique à moyen terme.

UELe partenariat engage directement la souveraineté numérique de la France en confiant à AMD les briques technologiques du supercalculateur Alice Recoque (1 exaflop) et de la future AI Factory France, pilier de la filière IA nationale.

💬 AMD pour "souveraineté numérique", c'est un oxymore qui fait mal à lire. Bon, sur le papier, un exaflop avec Alice Recoque et l'accès aux programmes de formation AMD, c'est du concret pour les chercheurs et les startups qui galèrent à avoir du compute. Mais confier les fondations de ta filière IA nationale à un acteur américain en appelant ça de l'autonomie stratégique, faut avoir un sacré sens de l'humour.

InfrastructureOpinion
1 source
32Ars Technica AI 

Mozilla lance un client IA Thunderbolt axé sur l'infrastructure auto-hébergée

Mozilla vient d'annoncer Thunderbolt, un nouveau client IA destiné aux entreprises qui souhaitent héberger leur propre infrastructure d'intelligence artificielle sans dépendre de services cloud tiers. Construit sur Haystack, un framework open source permettant de créer des pipelines IA modulaires et personnalisables, Thunderbolt se positionne comme ce que Mozilla appelle un "sovereign AI client". Il est compatible avec n'importe quelle API de type OpenAI ou ACP, incluant des modèles comme Claude, DeepSeek, Codex ou OpenCode, et peut s'appuyer sur une base de données SQLite locale comme référentiel de données hors ligne. Le système propose également un chiffrement de bout en bout optionnel et des contrôles d'accès au niveau de l'appareil. Pour les entreprises, l'enjeu est considérable : garder un contrôle total sur la pile technologique IA signifie que les données sensibles ne transitent jamais vers des serveurs externes. C'est une réponse directe aux craintes croissantes des organisations face aux risques de fuite de données confidentielles vers des fournisseurs cloud comme OpenAI ou Google. En permettant l'intégration de données d'entreprise stockées localement via des protocoles ouverts, Thunderbolt s'adresse en priorité aux secteurs soumis à des contraintes réglementaires strictes : finance, santé, défense ou administrations publiques. Mozilla entre ainsi sur un marché de plus en plus encombré de solutions IA souveraines, où des acteurs comme Mistral AI en France ou diverses initiatives européennes défendent déjà le principe d'une IA indépendante des géants américains. La démarche est cohérente avec l'ADN de Mozilla, organisation à but non lucratif historiquement engagée pour un internet ouvert et décentralisé. Thunderbolt représente un pivot stratégique pour la fondation, qui cherche à monétiser son positionnement éthique dans un marché IA dominé par quelques grandes plateformes. Les suites dépendront de l'adoption par les développeurs du framework Haystack sous-jacent et de la capacité de Mozilla à convaincre les équipes IT d'entreprise de franchir le pas vers l'auto-hébergement.

UELes entreprises européennes soumises au RGPD et à l'AI Act peuvent héberger leur infrastructure IA localement avec Thunderbolt, évitant le transfert de données sensibles vers des fournisseurs cloud américains.

OutilsOutil
1 source
33Le Big Data 

Pourquoi les infrastructures cloud dédiées à l’IA deviennent un enjeu stratégique en Europe ?

Le groupe SWI (Stoneweg Icona Group) a annoncé l'acquisition d'une participation majoritaire dans Polarise, une société allemande spécialisée dans les infrastructures cloud pour l'intelligence artificielle, valorisant cette dernière à 500 millions d'euros. En parallèle, SWI s'engage à injecter un milliard d'euros supplémentaires pour accélérer le développement de ce qui se veut le premier opérateur d'infrastructures numériques souveraines à l'échelle européenne. Polarise dispose déjà de 14 centres de données opérationnels à travers l'Europe, d'une capacité totale de 2,3 GW via sa plateforme AiOnX, et d'un partenariat privilégié avec Nvidia lui donnant accès direct aux GPU les plus puissants du marché. La société a également lancé la première "AI Factory" d'Allemagne en collaboration avec Deutsche Telekom, positionnant d'emblée ce rapprochement comme une initiative industrielle de premier plan. Max-Hervé George, fondateur et PDG de SWI Group, pilote cette stratégie d'intégration verticale, couvrant la chaîne complète du foncier aux logiciels cloud. L'enjeu est considérable : les entreprises et gouvernements européens cherchent à réduire leur dépendance aux hyperscalers américains, AWS, Azure, Google Cloud, pour les charges de travail les plus sensibles. L'acquisition permet à SWI de proposer un modèle "GPU-as-a-Service" permettant aux organisations de louer de la puissance de calcul GPU à la demande, sans investissement lourd en matériel, via une infrastructure localisée en Europe et soumise au droit européen. Pour les industries de pointe en Allemagne, en France ou en Norvège, cela représente un accès à des capacités de calcul haute performance sans compromis sur la souveraineté des données. Ce modèle favorise également une innovation plus rapide pour les startups et PME qui n'ont pas les moyens de construire leur propre infrastructure. Cette opération s'inscrit dans un mouvement plus large de structuration de la filière IA européenne face à la domination des géants américains et à la montée en puissance des acteurs chinois. L'Union européenne multiplie depuis plusieurs années les appels à bâtir une capacité numérique autonome, notamment à travers le règlement sur l'IA et les investissements du programme Horizon. La rareté des GPU Nvidia, dont Polarise est revendeur agréé, confère à cette alliance un avantage concurrentiel structurel dans un marché sous tension. Les prochaines étapes visent l'extension géographique vers l'Allemagne et la Norvège, deux pays disposant d'une énergie abondante et bon marché indispensable pour alimenter ces infrastructures énergivores. Si SWI tient ses engagements d'investissement, le groupe pourrait devenir un acteur de référence pour les contrats publics et les grandes entreprises cherchant une alternative crédible aux solutions extraeuropéennes.

UEL'acquisition crée un opérateur cloud souverain européen offrant aux entreprises et gouvernements de l'UE une alternative concrète aux hyperscalers américains pour leurs charges de travail sensibles, avec accès aux GPU Nvidia via une infrastructure soumise au droit européen.

InfrastructureOpinion
1 source
34Next INpact 

Mythos : l’Europe tenue à l’écart du modèle IA le plus ambitieux du moment

Anthropic a dévoilé Mythos, son nouveau grand modèle de langage spécialisé dans la cybersécurité, en limitant drastiquement son accès à une quarantaine d'organisations et une dizaine d'entreprises, toutes américaines. Le modèle s'inscrit dans le projet Glasswing, dont l'objectif est de laisser le LLM analyser le code de logiciels pour détecter des bugs, corriger des vulnérabilités et boucher des failles de sécurité. JPMorgan Chase est le seul établissement bancaire partenaire confirmé à ce stade. Aux États-Unis, les banques ont été encouragées à adopter Mythos pour renforcer leurs systèmes. L'administration Trump a été directement présentée au modèle, malgré une relation tendue avec Anthropic : le gouvernement américain a désigné l'entreprise « fournisseur à risque pour la sécurité nationale » après qu'elle a refusé d'accorder une licence pour certains usages militaires, un différend qui se règle désormais devant les tribunaux. En Europe, sur les huit agences de cybersécurité interrogées par Politico, seule l'agence fédérale allemande BSI a indiqué avoir engagé des discussions avec Anthropic, sans pour autant avoir pu tester le modèle. Le Royaume-Uni fait figure d'exception : l'AISI, son organisme dédié à la sécurité de l'IA, a publié le 13 avril une première évaluation indépendante des capacités offensives de Mythos. Cette mise à l'écart de l'Europe illustre une fracture concrète dans l'accès aux technologies d'IA de pointe. Les infrastructures critiques européennes, gouvernements compris, n'ont pas été conviés au projet alors même qu'elles seraient potentiellement parmi les premières bénéficiaires d'un tel outil. L'agence néerlandaise NCSC-NL a souligné l'impossibilité de vérifier l'impact réel des vulnérabilités identifiées par Mythos, faute de détails techniques accessibles. Ce manque de transparence place les régulateurs européens dans une position d'observateurs passifs face à un modèle dont Anthropic elle-même revendique le potentiel « dévastateur » dans sa propre communication. L'épisode Mythos révèle une tension structurelle entre la puissance réglementaire européenne et sa dépendance technologique envers les acteurs américains. L'AI Act, malgré son ambition, ne garantit pas à l'Union un accès aux modèles les plus sensibles développés outre-Atlantique. Comme le résume Daniel Privitera, de l'ONG allemande KIRA, « l'Europe ne dispose actuellement d'aucun plan pour garantir cet accès ». La distribution sélective de Mythos préfigure un enjeu qui va s'amplifier : dans un monde où les capacités offensives et défensives en cybersécurité reposent de plus en plus sur des LLM propriétaires, la souveraineté numérique se jouera aussi sur la capacité à accéder aux modèles de frontier, pas seulement à les réguler.

UELes agences de cybersécurité européennes, dont l'ANSSI en France, sont explicitement exclues de Mythos, laissant les infrastructures critiques du continent sans accès à un outil de détection de vulnérabilités que les États-Unis déploient déjà à l'échelle fédérale et bancaire.

SécuritéOpinion
1 source
35The Verge AI 

Microsoft teste des agents IA similaires à OpenClaw pour 365 Copilot

Microsoft explore l'intégration de fonctionnalités inspirées d'OpenClaw dans son assistant 365 Copilot, selon un rapport de The Information. Omar Shahine, vice-président corporate de Microsoft, a confirmé à la publication que la société « explore le potentiel de technologies comme OpenClaw dans un contexte d'entreprise ». L'objectif affiché est de permettre à 365 Copilot de « fonctionner de manière autonome en continu », en exécutant des tâches au nom des utilisateurs sans intervention humaine constante. Cette évolution marquerait un tournant significatif pour la suite bureautique de Microsoft, utilisée par des centaines de millions de professionnels dans le monde. Un Copilot capable d'agir en autonomie permanente, traiter des e-mails, planifier des réunions, rédiger des documents, transformerait l'assistant d'un outil réactif en un véritable agent proactif. Pour les entreprises, cela représente autant une promesse de productivité qu'un défi en matière de contrôle, de conformité et de sécurité des données. OpenClaw est une plateforme open-source qui permet de créer des agents IA tournant localement sur l'appareil de l'utilisateur, sans dépendre du cloud. Sa popularité a fortement progressé ces derniers mois, portée par l'intérêt croissant pour les agents autonomes et la souveraineté des données. Microsoft n'est pas seul sur ce terrain : Google, Salesforce et plusieurs startups misent également sur les agents IA d'entreprise. L'intégration éventuelle dans 365 Copilot, déjà déployé chez de nombreuses grandes entreprises, donnerait à Microsoft un avantage concurrentiel considérable dans la course aux assistants professionnels autonomes.

UELes entreprises européennes utilisant Microsoft 365 devront évaluer les implications de conformité RGPD et d'AI Act si Copilot évolue vers une exécution autonome et continue de tâches en leur nom.

💬 Un agent qui gère tes mails et réunions sans qu'on lui demande, c'est ce que tout le monde promet depuis 2 ans. Là c'est Microsoft qui passe à l'acte, avec une base de déploiement déjà massive et une technologie (OpenClaw) conçue justement pour tourner en local, sans dépendre du cloud. Les DPO européens vont avoir du boulot.

OutilsOutil
1 source
36Numerama 

LM Studio rachète Locally AI, l’application française pour installer un LLM local sur son iPhone

LM Studio, logiciel américain spécialisé dans l'exécution de modèles de langage en local sur Mac, a annoncé l'acquisition de Locally AI, une application française dédiée à l'iPhone. Locally AI permettait aux utilisateurs d'installer et de faire tourner directement sur leur appareil des modèles open source tels que Qwen d'Alibaba ou Gemma de Google, sans passer par le cloud. L'application se distinguait également par l'un des rares accès publics au modèle Apple Foundation, que la firme de Cupertino réserve normalement en exclusivité à ses propres fonctions Apple Intelligence. Cette acquisition marque une étape importante dans la démocratisation de l'IA locale sur mobile. En intégrant Locally AI à son écosystème, LM Studio étend son périmètre au-delà du Mac et s'impose comme un acteur transversal sur les plateformes Apple, couvrant désormais à la fois ordinateurs et smartphones. Pour les utilisateurs, cela représente une garantie de confidentialité renforcée : les données restent sur l'appareil, sans transmission à des serveurs tiers, ce qui intéresse particulièrement les professionnels soucieux de la souveraineté de leurs données. Le rachat s'inscrit dans une tendance de fond : la course aux modèles légers et efficaces capables de tourner sur du matériel grand public. Apple Silicon a ouvert la voie en offrant des puces suffisamment performantes pour inférer des modèles de plusieurs milliards de paramètres directement sur iPhone ou Mac. LM Studio, en consolidant l'offre iOS et macOS sous une même bannière, se positionne comme la référence de l'IA on-device dans l'univers Apple, face à des concurrents comme Ollama ou GPT4All qui restent cantonnés au desktop.

UEL'acquisition de Locally AI, startup française, par LM Studio illustre la consolidation du marché de l'IA on-device au profit d'acteurs américains, soulevant des questions de souveraineté numérique pour les professionnels français qui misaient sur cette solution indépendante.

BusinessOpinion
1 source
37Le Big Data 

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

En 2026, deux géants se livrent une bataille ouverte pour le contrôle de l'infrastructure de l'intelligence artificielle mondiale. D'un côté, Nvidia capte entre 80 et 90 % du marché des GPU pour centres de données, enchaînant les trimestres records grâce à une demande pour ses puces Blackwell qui dépasse toutes les prévisions. De l'autre, Meta, dirigé par Mark Zuckerberg, a décidé de rompre sa dépendance à ce fournisseur unique en annonçant jusqu'à 135 milliards de dollars d'investissements en capital pour 2026, dont un contrat historique de 6 gigawatts de puces AMD. Le marché mondial de l'IA générative devrait franchir 100 milliards de dollars d'ici fin 2026, porté par une adoption professionnelle massive : près de 80 % des entreprises prévoient d'intégrer des API d'IA ou de déployer des modèles personnalisés dans leurs processus. Les revenus issus des applications mobiles boostées à l'IA devraient doubler entre 2024 et 2026, avec une répartition géographique marquée : 37,3 milliards de dollars pour les États-Unis (+60 %), 14,7 milliards pour la Chine (+72 %), et une projection de 20 milliards pour la France à horizon 2030. L'enjeu dépasse la simple guerre commerciale entre deux entreprises. Ce que Meta cherche à construire, c'est une souveraineté technologique sur sa propre pile IA, de l'infrastructure physique jusqu'aux modèles. Tant que Nvidia reste le passage obligé pour tout acteur sérieux de l'IA, le géant de Menlo Park reste exposé à des pénuries, des hausses de prix et des délais de livraison qu'il ne contrôle pas. La diversification vers AMD n'est pas un choix technique anodin : c'est un signal politique adressé à toute l'industrie. En parallèle, les joueurs grand public risquent de subir les conséquences de cette course aux serveurs IA, Nvidia orientant clairement sa production vers les centres de données au détriment du segment gaming. La véritable forteresse de Nvidia ne réside pas dans ses puces mais dans son écosystème logiciel CUDA, standard industriel dominant depuis plus de quinze ans, que la concurrence peine à détrôner malgré des investissements considérables. L'architecture Rubin, attendue en succession des Blackwell, devrait creuser encore l'écart en termes de performances brutes. Meta n'est pas seul dans cette tentative de diversification : Google avec ses TPU, Amazon avec ses Trainium, et Microsoft via ses investissements dans OpenAI cherchent tous à réduire leur exposition à un seul fournisseur. La question qui structure désormais toute la filière est celle des infrastructures : les réseaux électriques, les capacités de refroidissement et les chaînes d'approvisionnement en semi-conducteurs peuvent-ils absorber une demande qui double tous les dix-huit mois ? C'est sur ce terrain physique, autant que logiciel, que se jouera la prochaine phase de la course à l'IA.

UELes entreprises européennes restent structurellement dépendantes de l'écosystème Nvidia/CUDA pour leurs projets IA, rendant leur accès à l'infrastructure coûteux et soumis aux arbitrages de production d'acteurs hors UE.

InfrastructureOpinion
1 source
Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence
38Le Big Data 

Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence

Mistral AI, la licorne française valorisée 11,7 milliards d'euros, a publié un document détaillant 22 mesures d'urgence pour permettre à l'Europe de ne pas se laisser distancer par les États-Unis et la Chine dans la course à l'intelligence artificielle. Parmi les propositions phares figure la création d'une "AI blue card", un titre de séjour simplifié inspiré de la carte bleue européenne, destiné à faciliter l'installation de chercheurs et développeurs étrangers sur le continent. L'entreprise appelle également à instaurer une préférence européenne dans les marchés publics, à introduire des incitations fiscales pour l'adoption d'infrastructures locales, et à centraliser les oeuvres du domaine public afin d'alimenter l'entraînement des modèles d'IA sans dépendre des plateformes étrangères. Pour donner corps à sa vision, Mistral AI a levé 830 millions de dollars de dette, destinés notamment à la construction d'un centre de données en France, avec un objectif de plus d'un milliard d'euros de chiffre d'affaires d'ici 2026. Ces propositions s'attaquent à un déséquilibre structurel documenté : sur 1 400 milliards de dollars investis dans le numérique à l'échelle mondiale, 80 % sont captés par les États-Unis. L'Europe dispose des talents et d'une capacité de financement, mais peine à organiser un marché cohérent qui permette à ses acteurs de rivaliser. Si les mesures proposées par Mistral étaient adoptées, elles changeraient concrètement les règles du jeu pour les entreprises et administrations européennes, qui seraient incitées à privilégier des solutions locales plutôt que de s'appuyer sur AWS, Azure ou Google Cloud. Pour les chercheurs étrangers, la "AI blue card" représenterait un signal fort que l'Europe entend sérieusement concurrencer la Silicon Valley en matière d'attractivité. Ces propositions s'inscrivent dans un contexte de prise de conscience accélérée sur la souveraineté technologique en Europe. OpenAI elle-même a publié récemment 13 pages de recommandations sur l'encadrement de l'automatisation, signe que les grands acteurs cherchent à peser sur les débats réglementaires avant que les gouvernements ne tranchent. Mistral, fondée en 2023 par d'anciens chercheurs de DeepMind et Meta, s'est rapidement imposée comme le champion européen de l'IA générative, avec des modèles open source compétitifs face aux offres américaines. En publiant ce plan en 22 points, la startup sort d'une posture purement technique pour entrer dans le débat politique et industriel, à un moment où la Commission européenne et les États membres cherchent encore leur doctrine face à la montée en puissance des grands modèles. Les prochains mois seront décisifs : si ces mesures trouvent un écho à Bruxelles ou à Paris, elles pourraient redéfinir les conditions dans lesquelles se développe l'IA en Europe.

UEMistral AI, licorne française, propose 22 mesures concrètes, préférence européenne dans les marchés publics, 'AI blue card' pour les talents étrangers, incitations fiscales pour l'infrastructure locale, qui pourraient redéfinir les règles du jeu pour les entreprises et administrations françaises et européennes.

RégulationReglementation
1 source
Santé : comment l'IA pourrait transformer les remboursements en outils de prédiction médicale
39La Tribune 

Santé : comment l'IA pourrait transformer les remboursements en outils de prédiction médicale

La Direction de la recherche, des études, de l'évaluation et des statistiques (Drees) a publié une étude démontrant que des modèles d'intelligence artificielle peuvent anticiper avec précision l'apparition de pathologies lourdes en exploitant le Système national des données de santé (SNDS). Cette base de données, constituée de l'ensemble des remboursements de l'Assurance maladie française, représente l'un des gisements de données médicales les plus exhaustifs au monde, couvrant près de 70 millions d'assurés sur plusieurs décennies. L'approche clé consiste à traiter les parcours de soins, enchaînements de consultations, prescriptions, hospitalisations, comme des séquences textuelles, permettant aux algorithmes de type transformeur d'y détecter des motifs invisibles aux biostatistiques classiques. Les résultats montrent que ces modèles surpassent significativement les méthodes statistiques traditionnelles pour prédire des maladies chroniques ou des complications graves avant leur déclaration clinique. Pour les médecins et les organismes de santé publique, cela ouvre la voie à une médecine préventive ciblée : identifier les patients à risque élevé plusieurs mois à l'avance, prioriser les interventions et potentiellement réduire la charge sur les hôpitaux. Les économies potentielles pour le système de santé sont considérables, dans un contexte de déficit chronique de l'Assurance maladie. Ces avancées ne vont pas sans tensions. L'exploitation du SNDS, bien que réglementée par la CNIL et le Health Data Hub, soulève des questions persistantes sur la confidentialité des données et les risques de discrimination algorithmique, notamment envers les populations défavorisées, souvent moins bien représentées dans les parcours de soins tracés. Se pose également la question de la souveraineté industrielle : qui développe ces modèles, sur quelle infrastructure, et au bénéfice de qui ? La France dispose d'un actif stratégique rare ; encore faut-il qu'elle en garde la maîtrise.

UEL'étude de la Drees exploite directement le SNDS, base de données de l'Assurance maladie française couvrant 70 millions d'assurés, et soulève des enjeux de souveraineté industrielle et de gouvernance réglementaire (CNIL, Health Data Hub) propres à la France.

💬 Le SNDS, c'est littéralement le meilleur dataset médical du monde occidental, et on commence enfin à en faire quelque chose d'utile. Traiter des parcours de soins comme des séquences textuelles pour les passer dans des transformeurs, c'est une idée simple en apparence, mais les résultats sur la prédiction de pathologies lourdes sont solides. La vraie question, c'est pas la technique, c'est qui va capter la valeur : un acteur français, européen, ou un géant américain qui lorgne dessus depuis des années.

RecherchePaper
1 source
Mistral dévoile 22 mesures dédiées à l’IA pour réveiller l’Europe avant qu’il ne soit trop tard
40Siècle Digital 

Mistral dévoile 22 mesures dédiées à l’IA pour réveiller l’Europe avant qu’il ne soit trop tard

Mistral AI a publié un manifeste détaillant 22 propositions concrètes pour permettre à l'Europe de rattraper son retard dans la course mondiale à l'intelligence artificielle. Arthur Mensch, cofondateur et PDG de la startup française, tire la sonnette d'alarme : selon lui, les citoyens, les entreprises et les gouvernements européens sont aujourd'hui « dépendants d'une domination étrangère », celle des géants américains et des acteurs chinois qui contrôlent les modèles, les infrastructures et les données sur lesquels repose l'IA mondiale. Ces 22 mesures ciblent trois leviers stratégiques : l'attraction et la rétention des talents, l'orientation des marchés publics vers des solutions souveraines, et l'accès aux données. L'enjeu est considérable pour l'industrie européenne. Si les administrations et entreprises du continent continuent de s'appuyer exclusivement sur des modèles américains ou chinois, elles transfèrent de facto leurs données sensibles et leur souveraineté technologique à des acteurs étrangers soumis à des législations incompatibles avec le droit européen. Orienter les marchés publics vers des fournisseurs comme Mistral permettrait de financer un écosystème local tout en réduisant cette dépendance structurelle. Mistral, fondée en 2023 et valorisée à plus de six milliards de dollars, s'impose comme le principal champion européen face à OpenAI et Google. Cette prise de position intervient dans un contexte de débat intense sur le AI Act européen et les appels répétés à construire une « IA souveraine ». En publiant ces mesures, Arthur Mensch cherche à peser sur l'agenda politique européen avant que l'écart technologique ne devienne définitivement impossible à combler.

UEMistral, champion français de l'IA valorisé à plus de 6 milliards de dollars, propose 22 mesures pour réduire la dépendance européenne aux modèles étrangers, avec des implications directes sur les marchés publics français et la souveraineté numérique de l'UE.

RégulationReglementation
1 source
ZD Tech : brevets 2025, pourquoi l'Europe surprend avec une accélération historique dans l'IA et la 6G
41ZDNET FR 

ZD Tech : brevets 2025, pourquoi l'Europe surprend avec une accélération historique dans l'IA et la 6G

L'Office européen des brevets (OEB) a enregistré en 2025 un record historique avec plus de 200 000 demandes de brevets déposées sur le continent, une première dans son histoire. Cette hausse, portée notamment par les secteurs de l'intelligence artificielle et de l'informatique quantique, traduit une dynamique d'innovation sans précédent en Europe. Les dépôts liés à l'IA ont progressé à un rythme particulièrement soutenu, reflétant la course mondiale aux technologies d'apprentissage automatique et de traitement du langage naturel. Ce chiffre symbolique dépasse la simple statistique : il signale un repositionnement stratégique de l'Europe dans la compétition technologique mondiale, longtemps dominée par les États-Unis et la Chine. Sur le terrain de la 6G et des semi-conducteurs, les inventeurs européens affichent une progression inattendue, deux domaines considérés comme critiques pour la souveraineté numérique et industrielle des prochaines décennies. Ces brevets constituent un actif économique direct, ouvrant la voie à des licences, des partenariats et une capacité de négociation renforcée face aux géants américains et asiatiques. Cette accélération s'inscrit dans le sillage des politiques industrielles engagées par l'Union européenne, notamment le Chips Act européen et les investissements massifs dans la recherche fondamentale via Horizon Europe. La montée en puissance de la 6G survient alors que les standards de la prochaine génération de réseaux mobiles sont encore en cours de définition, offrant à l'Europe une fenêtre d'opportunité pour peser sur les normes internationales avant que le marché ne soit verrouillé par quelques acteurs dominants.

UEL'Europe améliore concrètement sa capacité de négociation sur les standards 6G et les licences de semi-conducteurs, réduisant sa dépendance technologique face aux États-Unis et à la Chine.

InfrastructureOpinion
1 source
OpenAI esquisse une économie de l'IA : fonds souverains, taxes sur les robots et semaine de quatre jours
42TechCrunch AI 

OpenAI esquisse une économie de l'IA : fonds souverains, taxes sur les robots et semaine de quatre jours

OpenAI a publié un document de politique économique dans lequel l'entreprise propose une série de mesures pour atténuer les effets de l'intelligence artificielle sur l'emploi et les inégalités. Parmi les pistes évoquées figurent une taxation des profits générés par l'IA, la création de fonds souverains publics alimentés par ces revenus, des filets de sécurité sociale élargis, une semaine de travail de quatre jours et une forme de dividende universel lié aux gains de productivité de l'IA. Ces propositions interviennent alors que les décideurs politiques cherchent des réponses concrètes à une question de plus en plus pressante : comment redistribuer équitablement les richesses produites par l'automatisation ? Pour des millions de travailleurs exposés aux déplacements d'emploi, ces mécanismes représenteraient une transformation profonde du contrat social, en faisant de l'IA un moteur de prospérité partagée plutôt qu'une source de concentration des richesses. OpenAI occupe une position paradoxale en formulant ces recommandations : c'est l'une des entreprises qui accélère le plus la disruption qu'elle propose de corriger. Le document s'inscrit dans un débat croissant entre Silicon Valley, gouvernements et économistes sur la gouvernance de l'IA, alors que des propositions similaires circulent en Europe et que le G7 commence à intégrer la question fiscale liée à l'automatisation dans ses agendas.

UELes propositions d'OpenAI s'inscrivent dans un débat européen actif sur la fiscalité de l'IA et la redistribution des gains de productivité, le G7 ayant déjà intégré ces questions fiscales liées à l'automatisation à son agenda.

RégulationReglementation
1 source
Souveraineté numérique : Bull passe à l’offensive avec 500 embauches
43La Tribune 

Souveraineté numérique : Bull passe à l’offensive avec 500 embauches

Bull, l'entreprise française spécialisée dans les supercalculateurs, relancée par l'État français après sa scission d'Atos, annonce un plan de 500 recrutements, réalisés majoritairement en Europe. Ce mouvement offensif cible les domaines des supercalculateurs haute performance et de l'intelligence artificielle, deux secteurs jugés stratégiques pour l'indépendance technologique nationale. Cette offensive de recrutement signale la volonté de Bull de s'imposer comme un acteur souverain crédible face aux géants américains et asiatiques du calcul intensif. Dans un contexte où la puissance de calcul conditionne directement la compétitivité industrielle, la recherche scientifique et les capacités de défense, disposer d'un champion national dans ce domaine représente un enjeu majeur pour la France et l'Europe. Les 500 postes visent à renforcer les équipes d'ingénierie et à accélérer le développement de solutions locales non soumises aux lois extraterritoriales américaines. Bull a été séparé d'Atos lors de la restructuration du groupe technologique français, lui-même en difficulté financière depuis plusieurs années. L'État, actionnaire de référence, a choisi de préserver et de dynamiser cette branche stratégique plutôt que de la céder. Cette décision s'inscrit dans une tendance européenne plus large de réinvestissement dans les infrastructures numériques souveraines, portée notamment par le plan France 2030 et les ambitions du projet EuroHPC.

UEBull, champion national du calcul intensif soutenu par l'État français, recrute 500 ingénieurs majoritairement en Europe pour développer des alternatives souveraines aux solutions HPC et IA soumises aux lois extraterritoriales américaines.

InfrastructureActu
1 source
« Une société vitale pour le pays » : c’est quoi cette entreprise française d’IA et de minage que Xavier Niel a sauvée
44Frandroid 

« Une société vitale pour le pays » : c’est quoi cette entreprise française d’IA et de minage que Xavier Niel a sauvée

Xavier Niel, fondateur de Free et figure incontournable de la tech française, est intervenu pour sauver Exaion, une ancienne filiale d'EDF spécialisée dans l'intelligence artificielle et le minage de cryptomonnaies. C'est l'Élysée en personne qui aurait sollicité le patron de l'opérateur télécoms pour orchestrer ce sauvetage discret, considérant l'entreprise comme une société d'importance vitale pour le pays. Les détails financiers du montage restent partiellement confidentiels, mais l'opération témoigne d'une intervention directe au plus haut niveau de l'État. Exaion occupe une position rare dans le paysage technologique français : elle combine infrastructure de calcul haute performance, capacités d'IA et activité de minage de cryptomonnaies, un triptyque stratégique à l'heure où la souveraineté numérique est devenue une priorité gouvernementale. Laisser cette entité tomber dans des mains étrangères ou disparaître aurait pu priver la France d'une infrastructure critique pour le traitement de données sensibles et la compétitivité dans la course mondiale à l'IA. Née au sein d'EDF, Exaion s'est développée à l'intersection de l'énergie et du numérique, deux secteurs où la France cherche à consolider ses positions face aux géants américains et chinois. L'appel à Xavier Niel s'inscrit dans une tendance plus large où l'État français mobilise des industriels de confiance pour sécuriser des actifs technologiques jugés sensibles, sans passer par des nationalisations formelles. La suite dépendra de la stratégie que Niel entend déployer pour valoriser cet actif hybride, à mi-chemin entre data center souverain et infrastructure Web3.

UEL'État français a orchestré le sauvetage d'Exaion, ancienne filiale d'EDF, pour préserver une infrastructure souveraine de calcul haute performance jugée critique pour la compétitivité nationale en IA.

💬 Quand l'Élysée appelle Niel en direct pour sauver une boîte, tu mesures à quel point c'était tendu. Exaion c'est ce profil qu'on cherche à reconstituer depuis dix ans : calcul haute perf, IA, infra ancrée dans l'énergie plutôt que dans la Silicon Valley, et une légitimité souveraine qui ne s'achète pas. Ce que j'attends maintenant, c'est de voir si Niel en fait vraiment quelque chose, ou si ça reste un actif de confort pour l'État.

BusinessActu
1 source
L'équipe Qwen d'Alibaba publie Qwen3.5 Omni : un modèle multimodal natif pour le texte, l'audio, la vidéo et l'interaction en temps réel
45MarkTechPost 

L'équipe Qwen d'Alibaba publie Qwen3.5 Omni : un modèle multimodal natif pour le texte, l'audio, la vidéo et l'interaction en temps réel

L'équipe Qwen d'Alibaba a publié Qwen3.5-Omni, un modèle multimodal natif capable de traiter simultanément du texte, des images, de l'audio et de la vidéo au sein d'un seul pipeline computationnel. Disponible en trois variantes — Plus (raisonnement complexe), Flash (faible latence) et Light (efficacité) — le modèle phare Qwen3.5-Omni-Plus revendique des résultats de pointe sur 215 sous-tâches de compréhension et de raisonnement audio et audiovisuel, dépassant selon Alibaba le Gemini 3.1 Pro de Google sur la compréhension audio générale, la reconnaissance vocale et la traduction. Son encodeur audio natif (Audio Transformer) a été pré-entraîné sur plus de 100 millions d'heures de données audio-visuelles, et l'architecture supporte des fenêtres contextuelles de 256 000 tokens — soit plus de 10 heures d'audio continu ou 400 secondes de contenu vidéo 720p. Ce lancement marque un tournant dans la conception des modèles multimodaux : on passe des architectures « en patchwork », où des encodeurs spécialisés (comme Whisper pour l'audio) sont greffés sur un socle textuel, à des systèmes entièrement natifs et unifiés. Pour l'industrie, cela signifie des agents vocaux et visuels capables d'interaction en temps réel sans les pénalités de latence propres aux pipelines en cascade. L'architecture Thinker-Talker, couplée à un mécanisme Hybrid-Attention Mixture of Experts (MoE), permet au modèle d'allouer dynamiquement ses ressources selon la modalité dominante — favorisant les tokens visuels lors d'une analyse vidéo, par exemple — tout en conservant un débit compatible avec les services de streaming. Concrètement, les développeurs d'applications vocales, de systèmes de sous-titrage automatique ou d'assistants multimodaux disposent d'un socle technique plus robuste et moins coûteux à exploiter. La course aux modèles omnimodaux s'est accélérée depuis que Google a démontré avec Gemini la viabilité des architectures nativement multimodales, forçant les acteurs comme OpenAI, Meta et Alibaba à répondre. Qwen3.5-Omni s'inscrit dans la stratégie offensive d'Alibaba pour s'imposer comme alternative crédible aux modèles occidentaux, notamment sur les marchés asiatiques et auprès des entreprises sensibles à la souveraineté des données. Deux problèmes d'ingénierie spécifiques à l'interaction temps réel ont été adressés : la stabilité du flux de parole (via un mécanisme baptisé ARIA — Adaptive Rate Interleave Alignment, qui synchronise les tokens texte et audio de nature asymétrique) et la fluidité conversationnelle. Les benchmarks avancés par Alibaba — 8 tests de reconnaissance automatique de la parole, 156 tâches de traduction parole-texte dans des langues spécifiques, 43 tâches d'ASR ciblées — restent à valider par des évaluations indépendantes, mais positionnent déjà Qwen3.5-Omni comme un concurrent direct aux modèles les plus avancés du moment.

UELes entreprises européennes sensibles à la souveraineté des données disposent d'une alternative crédible aux modèles américains pour leurs déploiements d'agents vocaux et visuels multimodaux en temps réel.

💬 L'architecture native, c'est vraiment ce qui change la donne ici. Pas un Whisper greffé sur un LLM avec du scotch, mais un seul pipeline qui ingère tout en même temps, avec 100 millions d'heures d'entraînement audio-vidéo derrière. Les benchmarks Alibaba, bon, à vérifier en conditions réelles — mais le socle technique, lui, a l'air solide.

LLMsOpinion
1 source
Cohere lance un modèle ASR open-weight avec 5,4 % d'erreur — suffisant pour remplacer les API vocales en production
46VentureBeat AI 

Cohere lance un modèle ASR open-weight avec 5,4 % d'erreur — suffisant pour remplacer les API vocales en production

Cohere a lancé Transcribe, un modèle de reconnaissance vocale automatique (ASR) en open-weight, disponible depuis mars 2026 via API ou dans son Model Vault sous l'identifiant cohere-transcribe-03-2026. Avec 2 milliards de paramètres et une licence Apache-2.0 autorisant un usage commercial immédiat, le modèle affiche un taux d'erreur moyen sur les mots (WER) de 5,42 % — le meilleur score actuellement sur le classement ASR de Hugging Face. Il devance Whisper Large v3 d'OpenAI (7,44 %), ElevenLabs Scribe v2 (5,83 %) et Qwen3-ASR-1.7B (5,76 %). Transcribe prend en charge 14 langues : anglais, français, allemand, italien, espagnol, grec, néerlandais, polonais, portugais, chinois, japonais, coréen, vietnamien et arabe. Sur des benchmarks spécialisés, il obtient 8,15 % sur AMI (compréhension de réunions) et 5,87 % sur VoxPopuli (diversité d'accents). Ce lancement change concrètement la donne pour les entreprises qui construisent des workflows voix, des pipelines de transcription ou des systèmes de recherche audio. Jusqu'ici, elles devaient choisir entre des API fermées — précises mais problématiques pour la souveraineté des données — ou des modèles open source moins performants. Transcribe rompt ce compromis : il tourne sur l'infrastructure GPU locale d'une organisation, éliminant les risques de résidence des données et les pénalités de latence liées aux API externes. Pour les équipes qui construisent des pipelines RAG ou des agents IA intégrant de l'audio, c'est une voie directe vers la transcription de qualité production sans dépendance à un fournisseur cloud. Cohere se positionne depuis plusieurs années comme l'alternative "enterprise-first" aux grands modèles grand public, en misant sur le déploiement privé et la conformité réglementaire. Transcribe s'inscrit dans cette stratégie : là où Whisper avait été publié comme modèle de recherche sous licence MIT sans priorité commerciale immédiate, Cohere livre d'emblée un modèle prêt pour la production. La société précise avoir optimisé simultanément la précision (WER bas) et le débit (RTFx élevé), ce qui est techniquement difficile dans la catégorie des modèles de plus d'un milliard de paramètres. Les premiers utilisateurs ont salué notamment la capacité à rapatrier en interne des flux audio qui transitaient jusqu'alors par des API tierces — un enjeu croissant dans les secteurs soumis au RGPD ou aux réglementations sectorielles strictes comme la finance et la santé.

UELe modèle supporte le français et permet un déploiement on-premise éliminant les risques de résidence des données, un avantage direct pour les entreprises européennes soumises au RGPD dans les secteurs finance et santé.

OutilsOpinion
1 source
Mistral AI lève 830 millions de dollars pour un centre de données IA
47AI Business 

Mistral AI lève 830 millions de dollars pour un centre de données IA

Mistral AI a annoncé avoir levé 830 millions de dollars pour financer la construction d'un centre de données dédié à l'intelligence artificielle, qui sera implanté en région parisienne. Cette infrastructure, alimentée par des milliers de puces Nvidia, représente l'un des investissements les plus importants jamais réalisés dans l'IA en Europe. La startup française, fondée en 2023, consolide ainsi sa position parmi les acteurs majeurs du secteur à l'échelle mondiale. Ce centre de calcul donnera à Mistral une capacité d'entraînement et d'inférence souveraine, réduisant sa dépendance aux infrastructures cloud américaines comme AWS ou Azure. Pour les entreprises et institutions européennes soucieuses de la localisation de leurs données, cette infrastructure sur sol français représente une alternative crédible aux géants américains. C'est aussi un signal fort sur la capacité de l'Europe à construire une filière IA complète, du modèle jusqu'au silicium. Mistral s'inscrit dans une course mondiale à la puissance de calcul où les États-Unis et la Chine investissent des dizaines de milliards. La France, qui a fait de l'IA souveraine une priorité industrielle, bénéficie ici d'un effet d'entraînement : après les annonces gouvernementales du plan France 2030, un acteur privé passe à l'acte à grande échelle. Les prochains mois diront si d'autres startups européennes suivront cette voie ou si Mistral restera une exception dans un paysage dominé par les hyperscalers américains.

UEMistral AI construit un centre de calcul souverain en région parisienne, offrant aux entreprises et institutions françaises et européennes une alternative locale aux hyperscalers américains pour l'hébergement et l'inférence IA sensibles.

💬 830 millions pour un datacenter, c'est le moment où Mistral arrête de jouer dans la cour des grands et devient un grand. Ce qui m'intéresse vraiment là-dedans, c'est la souveraineté d'inférence : des boîtes françaises qui pourront faire tourner des modèles sans que leurs données passent par Virginia ou Oregon. Reste à voir combien ça coûtera à l'usage.

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA
48Next INpact 

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA

Mistral AI a finalisé lundi 30 mars un emprunt de 830 millions de dollars (722 millions d'euros) auprès d'un pool de sept banques pour équiper son datacenter de Bruyères-le-Châtel, au sud de Paris. Cet argent servira à acquérir 13 800 puces GB300 de NVIDIA, les processeurs de dernière génération destinés aux charges d'IA intensives. Une fois déployée, cette infrastructure portera la puissance informatique disponible pour la startup à 44 mégawatts. Le financement mobilise une majorité d'acteurs français — Bpifrance, BNP Paribas, Crédit Agricole CIB, HSBC, La Banque Postale et Natixis — ainsi que la banque japonaise MUFG (groupe Mitsubishi). La mise en service est annoncée pour le deuxième trimestre 2026. Cet investissement positionne Mistral comme le premier opérateur d'infrastructure IA souveraine en Europe capable d'offrir à ses clients institutionnels une puissance de calcul hors de toute juridiction extraterritoriale américaine. C'est l'enjeu central de l'offre Mistral Compute, lancée en juin 2025 et déjà contractualisée avec le ministère des Armées français en janvier 2026. Pour les gouvernements, administrations et grandes entreprises qui cherchent à déployer des modèles IA sans dépendre d'AWS, Azure ou Google Cloud, cette infrastructure représente une alternative concrète et européenne — un argument commercial de poids dans un contexte de tensions géopolitiques et de débats sur la souveraineté numérique. Le projet avait été annoncé en février 2025, avec Eclairion — spécialiste français des datacenters haute densité — comme partenaire de construction. À l'époque, l'intégrateur britannique devenu américain Fluidstack était également associé au projet, mais Bloomberg indique qu'il a depuis réorienté ses investissements vers les États-Unis, laissant le champ plus libre à une configuration franco-française. En décembre 2025, le CEO d'Eclairion évoquait encore un cluster de puces GB200 comme « la plus grosse machine d'IA de France » sur le point d'entrer en production pour Mistral — les cartes semblent avoir été rebattues depuis, avec une transition vers les GB300, génération supérieure. En parallèle, Mistral a annoncé en février 2026 un second investissement de 1,2 milliard d'euros dans un autre projet de datacenter, confirmant une stratégie d'expansion infrastructure qui va bien au-delà du seul développement de modèles de langage. La startup cofondée par Arthur Mensch se construit désormais en fournisseur de cloud souverain à part entière.

UEMistral installe à Bruyères-le-Châtel la première infrastructure IA souveraine d'Europe hors juridiction américaine, déjà contractualisée avec le ministère des Armées français, offrant aux institutions et entreprises européennes une alternative concrète aux hyperscalers américains.

💬 722 millions d'euros de dette pour acheter des GPU, c'est pas anodin comme pari. Bon, sur le papier le timing est parfait : les gouvernements européens cherchent désespérément une sortie des hyperscalers américains, et Mistral vient d'arriver avec 13 800 GB300 et un contrat Armées déjà dans la poche. Ce qui me frappe surtout, c'est le pivot : on parle plus d'une boîte de modèles, mais d'un vrai fournisseur de cloud souverain.

InfrastructureOpinion
1 source
Mistral AI lève 830 millions de dollars en dette pour financer un datacenter près de Paris
49TechCrunch AI 

Mistral AI lève 830 millions de dollars en dette pour financer un datacenter près de Paris

Mistral AI a annoncé une levée de 830 millions de dollars sous forme de dette pour financer la construction d'un centre de données situé près de Paris. La startup française, fondée en 2023, prévoit de mettre en service cette infrastructure dès le deuxième trimestre 2026. Ce financement par dette — distinct d'une levée en capital — lui permet de préserver sa structure actionnariale tout en mobilisant des ressources massives pour déployer ses propres capacités de calcul. Cette décision marque un tournant stratégique majeur : disposer de son propre data center permettra à Mistral de réduire sa dépendance aux fournisseurs cloud américains comme AWS ou Azure, de maîtriser ses coûts d'inférence à grande échelle, et de répondre aux exigences de souveraineté numérique de clients institutionnels et gouvernementaux européens. Pour l'industrie, c'est un signal fort que les acteurs IA européens entendent concurrencer les géants américains sur leur propre terrain — celui de l'infrastructure. Mistral s'est imposée comme le principal champion européen de l'IA générative, avec des modèles comme Mistral Large et Mixtral. La France a fait de l'IA souveraine une priorité nationale, et la startup bénéficie d'un soutien politique fort. Alors que les besoins en puissance de calcul explosent avec la montée en charge des usages LLM, contrôler son infrastructure devient un avantage concurrentiel décisif — et un argument commercial de poids face aux entreprises européennes soucieuses de la localisation de leurs données.

UELa construction d'un data center souverain près de Paris par Mistral AI renforce l'autonomie numérique française et européenne, offrant aux institutions et entreprises de l'UE une alternative aux hyperscalers américains pour leurs besoins en calcul IA.

💬 830 millions en dette, pas en capital, c'est malin. Mistral garde la main sur son actionnariat tout en se construisant une infra qui va peser lourd dans les appels d'offres publics, ceux où "hébergé en France" n'est plus un bonus mais un prérequis. Reste à voir si le datacenter tourne vraiment au T2 2026 comme annoncé.

Arthur Mensch, patron de Mistral AI, héraut d’une intelligence artificielle ouverte et souveraine
50Le Monde Pixels 

Arthur Mensch, patron de Mistral AI, héraut d’une intelligence artificielle ouverte et souveraine

Arthur Mensch, 31 ans, cofondateur et PDG de Mistral AI, s'est imposé comme la figure centrale du débat européen sur l'intelligence artificielle souveraine. Fondée en 2023 à Paris avec Charles Aznavour et Timothée Lacroix, la startup a levé plus de 1,1 milliard d'euros en moins de deux ans, atteignant une valorisation de 6 milliards de dollars — un record pour l'IA européenne. Sa stratégie repose sur la publication de modèles en open source, comme Mistral 7B ou Mixtral, qui rivalisent avec les géants américains à fraction du coût. Pour Mensch, l'open source n'est pas un choix technique mais un acte politique : permettre à n'importe quelle entreprise, gouvernement ou chercheur de déployer une IA sans dépendre d'OpenAI, Google ou Anthropic. Cette position séduit des acteurs publics européens soucieux de leur souveraineté numérique, notamment en France et en Allemagne, où Mistral a signé des contrats avec des administrations. Mensch incarne une troisième voie entre le capitalisme fermé de Silicon Valley et l'IA d'État chinoise. Ancien chercheur chez DeepMind et Google Brain, il joue un rôle croissant dans les discussions réglementaires européennes, plaidant pour un AI Act qui n'étouffe pas l'innovation open source. Avec le lancement de Mistral Large et de la plateforme Le Chat, la startup ambitionne de devenir le fournisseur d'IA de référence pour les entreprises européennes.

UEMistral AI, startup française valorisée 6 milliards de dollars, fournit des modèles open source aux administrations françaises et allemandes, incarnant une alternative souveraine aux fournisseurs américains pour les entreprises et gouvernements européens.

BusinessOpinion
1 source

Suivre Souveraineté IA en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour