Aller au contenu principal

Dossier Souveraineté IA — page 2

283 articles · page 2 sur 6

La bataille pour la souveraineté IA : Mistral, OVHcloud Dragon LLM, infrastructure souveraine européenne et alternatives au cloud américain.

Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles
51AWS ML Blog InfrastructureOpinion

Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles

Amazon Web Services a introduit une fonctionnalité appelée Cross-Region Inference (CRIS) dans Amazon Bedrock, son service d'IA générative managé, permettant aux entreprises européennes de router automatiquement leurs requêtes d'inférence vers plusieurs régions AWS au sein de zones géographiques prédéfinies. Concrètement, lorsqu'une application envoie une requête à un modèle comme Claude d'Anthropic ou un modèle Amazon Nova, CRIS peut la rediriger dynamiquement vers la région disposant de la meilleure capacité disponible, tout en maintenant les données dans un périmètre géographique contrôlé. Pour l'Europe, AWS propose des profils EU CRIS dont toutes les régions de destination sont situées exclusivement au sein de l'Union européenne. Les données transmises restent chiffrées et circulent uniquement sur le réseau privé AWS, sans jamais transiter par l'internet public. Ce mécanisme répond à un problème concret que rencontrent les entreprises européennes : la saturation des capacités de calcul GPU en période de forte demande, qui se traduit par des latences élevées ou des erreurs de disponibilité. En distribuant les requêtes sur plusieurs régions, les applications deviennent plus résilientes aux pics de charge et aux pannes locales. Du point de vue réglementaire, les profils EU CRIS sont conçus pour faciliter la conformité au RGPD, puisque le traitement reste borné à l'UE, un critère déterminant pour les secteurs soumis à des exigences strictes de résidence des données comme la finance, la santé ou les services publics. AWS souligne également que certains modèles sont disponibles à tarif réduit via les profils globaux CRIS, ajoutant un argument économique à l'argument technique. La pression réglementaire européenne sur le traitement des données par des fournisseurs cloud américains s'est intensifiée ces dernières années, notamment après les décisions de la CJUE sur les transferts transatlantiques de données. Les grands hyperscalers comme AWS, Google Cloud et Microsoft Azure ont tous investi massivement dans des infrastructures européennes et des offres de souveraineté pour répondre à ces contraintes. CRIS s'inscrit dans cette logique : plutôt que de forcer les clients à choisir une seule région et à subir ses limitations de capacité, AWS propose une abstraction qui optimise automatiquement tout en respectant les frontières réglementaires. La prochaine étape logique sera l'extension de ces profils géographiques à d'autres zones comme le Moyen-Orient ou l'Asie-Pacifique, et l'intégration de contrôles plus fins permettant aux entreprises de définir elles-mêmes les régions autorisées selon leurs obligations contractuelles ou sectorielles.

UELa fonctionnalité EU CRIS d'AWS Bedrock permet aux entreprises européennes de maintenir leurs traitements d'inférence IA exclusivement dans les frontières de l'UE, facilitant la conformité RGPD pour les secteurs finance, santé et services publics soumis à des exigences strictes de résidence des données.

1 source
PhysicsX lève 255 millions d’euros : la bataille de l’IA s’étend aux infrastructures stratégiques
52FrenchWeb 

PhysicsX lève 255 millions d’euros : la bataille de l’IA s’étend aux infrastructures stratégiques

PhysicsX, startup britannique spécialisée dans la simulation physique par intelligence artificielle, a bouclé une levée de fonds de 255 millions d'euros menée par Temasek, le fonds souverain singapourien. Ce tour de table, l'un des plus importants jamais réalisés dans le domaine de l'IA appliquée à l'ingénierie, positionne l'entreprise fondée par d'anciens chercheurs du CERN comme un acteur incontournable de ce que certains appellent déjà l'IA physique. PhysicsX développe des modèles capables de remplacer ou d'accélérer massivement les simulations numériques traditionnelles dans des secteurs comme l'aéronautique, l'énergie ou l'industrie automobile. L'enjeu est considérable : les simulations physiques représentent un goulot d'étranglement majeur dans la conception industrielle. Là où un calcul aérodynamique classique peut mobiliser des supercalculateurs pendant des heures, les modèles de PhysicsX promettent des résultats équivalents en quelques secondes. Pour les constructeurs, les énergéticiens et les fabricants d'équipements, cela signifie des cycles de développement réduits, des coûts abaissés et la possibilité d'explorer des espaces de conception jusqu'ici inaccessibles faute de capacité de calcul. Cette levée s'inscrit dans un mouvement plus large d'investissement dans l'IA dite "physique" ou "industrielle", distincte des grands modèles de langage grand public. Des acteurs comme Nvidia, avec ses outils de simulation, ou des startups concurrentes telles que Coreform et Pasteur Labs, s'attaquent au même marché. L'entrée de Temasek signale que les fonds souverains misent désormais sur cette verticale stratégique, jugée critique pour la souveraineté industrielle et la compétitivité économique à long terme.

UELes technologies de simulation IA de PhysicsX pour l'aéronautique, l'énergie et l'automobile concernent directement les industriels européens qui pourraient réduire leurs cycles de R&D, même si la startup est britannique et donc hors UE.

BusinessOpinion
1 source
☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA
53Next INpact 

☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA

L'administration Trump envisage de prendre des participations au capital des principaux laboratoires d'intelligence artificielle américains, selon des informations rapportées par le Wall Street Journal. Interrogé à bord d'Air Force One, Donald Trump a exprimé un intérêt direct pour l'idée, évoquant la possibilité de « créer un partenariat avec le public américain » et de rendre les citoyens « partenaires » des entreprises du secteur. Le mécanisme envisagé consisterait à redistribuer les gains futurs via un fonds souverain ou un dispositif similaire. Le 2 juin, Trump a par ailleurs signé un décret présidentiel, jugé en demi-teinte par les observateurs, instaurant un processus d'évaluation volontaire pour les modèles d'IA avancés, auquel OpenAI a confirmé sa participation. L'enjeu est considérable à mesure qu'OpenAI et Anthropic se rapprochent d'introductions en bourse potentiellement records. Une prise de participation publique permettrait à l'État fédéral de capter une fraction des valorisations futures, dans un secteur où les montants en jeu se chiffrent en centaines de milliards de dollars. Sur le plan politique, le projet répond aussi à une défiance croissante de la population américaine envers l'IA : 71 % des Américains s'opposent à l'installation de nouveaux centres de données. Offrir aux citoyens une part des bénéfices constituerait un levier pour rendre cette technologie politiquement acceptable, en transformant les contribuables en bénéficiaires directs plutôt qu'en spectateurs inquiets. Cette idée n'est pas née sous Trump : Sam Altman, fondateur et PDG d'OpenAI, la défend depuis des années, bien avant le lancement de ChatGPT. Pour élargir la coalition de soutien, il a rencontré le sénateur Bernie Sanders, figure de la gauche américaine, qui travaille de son côté sur une mesure bien plus radicale : transférer 50 % du capital des grandes entreprises d'IA vers un fonds public. En avril, OpenAI avait déjà proposé la création d'un tel fonds de redistribution directe vers les citoyens. Le gouvernement fédéral a d'ores et déjà démontré sa volonté d'intervenir dans le capital industriel, en acquérant 9,9 % d'Intel. Rien n'est toutefois officiellement décidé, et le risque d'un éclatement de la bulle IA, qui réduirait drastiquement la valeur de ces investissements publics, reste une hypothèse que personne ne peut exclure.

UEL'éventuelle prise de participation publique américaine dans les grands laboratoires d'IA pourrait nourrir le débat européen sur la gouvernance des technologies stratégiques et l'opportunité de créer des fonds souverains dédiés à l'IA.

💬 L'idée vient de Sam Altman, pas de Trump, c'est important de le rappeler. Il pousse ce truc depuis avant ChatGPT, et il vient quand même de mettre d'accord Trump et Bernie Sanders sur le même projet. Reste que placer du fric public sur des boîtes valorisées à 300 milliards avant leur IPO, c'est un sacré pari si la bulle tient pas.

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA
54NVIDIA AI Blog 

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA

Un an après que Jensen Huang, PDG de NVIDIA, et le Premier ministre britannique Keir Starmer ont pris l'engagement public de faire du Royaume-Uni un « créateur » et non un « consommateur » d'IA lors de la London Tech Week 2025, les premières réalisations concrètes se matérialisent. Le nombre de fournisseurs de cloud prévoyant de déployer des infrastructures IA sur le sol britannique a doublé en douze mois. Nebius va déployer trois nouvelles installations représentant 65 mégawatts à pleine capacité en 2027, CoreWeave s'installe dans les zones de croissance IA du gouvernement, et BT s'est associé à Nscale pour construire des datacenters souverains sur trois de ses sites existants. Au coeur du dispositif se trouve Isambard-AI, le supercalculateur le plus puissant du Royaume-Uni, assemblé autour de 5 400 puces NVIDIA GH200 Grace Hopper et alimenté à 100 % en électricité décarbonée. Le Fonds d'IA souverain du gouvernement s'appuie sur cette infrastructure pour financer des entreprises nationales, dont Ineffable Intelligence, qui développe la prochaine génération d'infrastructure d'apprentissage par renforcement en collaboration directe avec NVIDIA. Quatre startups membres du programme NVIDIA Inception illustrent l'ambition de ce fonds. Cosine développe une plateforme de codage IA souveraine destinée aux secteurs hautement réglementés, services financiers, infrastructures critiques, sécurité nationale, et entraîne via Isambard un grand modèle multimodal de type mixture-of-experts capable de traiter des types de données au-delà du texte et de l'image. Cursive construit des systèmes d'IA auto-apprenants à fenêtres de contexte étendues, capables de fonctionner de façon autonome sur de longues durées, en adoptant le framework NVIDIA Megatron-LM pour l'entraînement distribué. Doubleword, premier laboratoire britannique dédié à l'inférence, optimise l'ensemble de la pile logicielle pour maximiser le rapport qualité-coût : ses premiers résultats sur Isambard montrent des démarrages de modèles 70 fois plus rapides et une compression du cache KV quatre fois supérieure sans perte de qualité. Ce déploiement s'inscrit dans une tendance mondiale où les États cherchent à ne pas dépendre exclusivement d'infrastructures IA contrôlées par des acteurs américains. Pour le Royaume-Uni, la souveraineté numérique est devenue un argument commercial à part entière : les entreprises européennes et britanniques peuvent désormais proposer à leurs clients des garanties de localisation des données et de contrôle national que les géants américains ne peuvent offrir. La montée en puissance de l'écosystème NVIDIA au Royaume-Uni, avec sept autres partenaires cloud en attente de déploiement, signale que Londres entend rivaliser avec Paris, qui a fait d'annonces similaires autour de son propre plan IA. La question qui se pose désormais est de savoir si ces infrastructures souveraines produiront des modèles et des usages capables de concurrencer les grands acteurs américains et chinois, ou si elles resteront cantonnées à des niches réglementaires.

UELe déploiement souverain britannique crée une pression concurrentielle directe sur le plan IA français et offre aux entreprises européennes des garanties de localisation des données que les géants américains ne peuvent proposer.

InfrastructureActu
1 source
Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires
55The Decoder 

Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires

Sakana AI, une startup japonaise co-fondée par Llion Jones, l'un des huit co-auteurs du papier fondateur « Attention is All You Need » (2017), vient de lancer un laboratoire de recherche entièrement dédié à l'auto-amélioration récursive, connue sous le sigle RSI (Recursive Self-Improvement). Cette technologie consiste à concevoir des systèmes d'IA capables de s'optimiser eux-mêmes de façon itérative, sans dépendre d'une augmentation constante de la puissance de calcul disponible. Pour Sakana AI, le RSI constitue une alternative directe à la course aux datacenters et aux puces que se livrent les grands laboratoires américains comme OpenAI, Google DeepMind ou Meta, qui engloutissent des dizaines de milliards de dollars en infrastructure. L'idée centrale est d'obtenir des gains de performance en rendant les modèles capables de retravailler leur propre architecture ou leurs paramètres, plutôt qu'en empilant davantage de GPUs. Si cette piste aboutit, elle pourrait redistribuer les cartes entre acteurs bien dotés en capital et équipes plus agiles. Le RSI est aussi l'une des technologies les plus surveillées par les chercheurs en sécurité de l'IA. Anthropic, qui développe pourtant ses propres modèles frontier, met explicitement en garde contre les risques de contrôle associés à des systèmes capables de se redéfinir eux-mêmes. La tension est révélatrice : l'auto-amélioration récursive est à la fois perçue comme un levier de souveraineté technologique pour les acteurs hors Silicon Valley, et comme l'un des scénarios de risque les plus sérieux pour la sécurité à long terme de l'IA.

UESi le RSI tient ses promesses, les laboratoires européens à ressources limitées pourraient bénéficier d'une voie de compétitivité alternative à la course aux datacenters, réduisant leur dépendance aux infrastructures massives américaines.

💬 Sakana mise sur l'auto-amélioration récursive pour contourner la course au calcul. C'est le seul angle vraiment crédible si tu n'as pas dix milliards à mettre dans des datacenters, et avec Llion Jones à bord (un des auteurs d'"Attention is All You Need"), l'équipe a le niveau pour que ça soit autre chose qu'un pitch deck. Le hic, c'est que le RSI est aussi ce qu'Anthropic cite en tête de liste quand on leur demande ce qui les empêche de dormir.

RecherchePaper
1 source
NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming
56MarkTechPost 

NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming

NVIDIA a lancé Nemotron 3.5 ASR, un modèle de reconnaissance vocale automatique en streaming capable de transcrire 40 variantes linguistiques en temps réel depuis un seul checkpoint de 600 millions de paramètres. Publié en open weights sur Hugging Face sous licence OpenMDW-1.1, le modèle repose sur une architecture Cache-Aware FastConformer-RNNT qui intègre nativement la ponctuation et les majuscules, sans étape de post-traitement supplémentaire. Il couvre des langues aussi variées que l'anglais, le français, l'espagnol, l'arabe, le japonais, le coréen, le mandarin, le hindi ou le thaï, avec un mode de détection automatique de la langue (targetlang=auto) permettant de traiter des flux audio multilingues sans composant externe. La latence est configurable à l'inférence via un paramètre unique (attcontext_size), offrant des modes allant de 80 ms ultra-basse latence jusqu'à 1,12 seconde pour une précision maximale, sans nécessiter de réentraînement. Ce modèle s'attaque directement à l'un des principaux obstacles au déploiement industriel de la transcription vocale en temps réel : la complexité opérationnelle. Jusqu'ici, couvrir plusieurs langues imposait de maintenir autant de modèles distincts, de gérer des pipelines de détection de langue séparés, et de choisir entre latence et précision via des checkpoints différents. Nemotron 3.5 ASR supprime ces trois frictions en un seul déploiement. Pour les équipes produit qui développent des outils de sous-titrage en direct, des assistants vocaux multilingues ou des plateformes de transcription à grande échelle, cela représente une réduction significative de l'infrastructure et du coût d'exploitation. Le fait qu'il soit disponible gratuitement en self-hosting change également la donne face aux services cloud payants comme Nova-3 de Deepgram (~0,0077 $/min) ou Scribe v2 Realtime d'ElevenLabs (~0,28 $/heure). NVIDIA opère depuis plusieurs années une montée en puissance dans le domaine des modèles de traitement du langage parlé, notamment via sa division Nemotron Speech. Ce lancement s'inscrit dans une compétition intense entre acteurs open source et solutions propriétaires : Whisper large-v3 d'OpenAI reste la référence en transcription batch (99 langues, MIT), mais n'est pas natif au streaming ; AssemblyAI (Universal-3 Pro) et Speechmatics se positionnent sur le streaming temps réel, mais avec des couvertures linguistiques plus étroites ou des API fermées. NVIDIA entre dans ce segment avec un modèle à la fois performant, polyglotte et librement hébergeable, ce qui pourrait accélérer son adoption dans les environnements souverains ou à contraintes de confidentialité forte. La prochaine étape probable sera l'intégration dans les pipelines NIM (NVIDIA Inference Microservices) pour simplifier encore le déploiement en production.

UELe modèle couvre explicitement le français parmi ses 40 variantes linguistiques, et son mode self-hosting gratuit facilite le déploiement dans des environnements européens soumis aux exigences de souveraineté des données, réduisant la dépendance aux API cloud américaines payantes.

💬 Un seul checkpoint pour 40 langues en streaming, ponctuation et majuscules intégrées nativement : c'est le genre de truc qu'on attendait depuis 2 ans. Couvrir plusieurs langues en temps réel imposait jusqu'ici de gérer autant de modèles distincts plus un détecteur de langue en amont, bref une usine à gaz. Et là, en self-hosting gratuit face à Deepgram à 0,0077 $ la minute, les équipes qui hésitaient vont vite trancher.

OutilsOpinion
1 source
Miso Labs lance Miso One : la nouvelle référence open source de la synthèse vocale ?
57Le Big Data 

Miso Labs lance Miso One : la nouvelle référence open source de la synthèse vocale ?

Miso Labs a lancé le 3 juin 2026 Miso One, un modèle de synthèse vocale open source de 8 milliards de paramètres conçu pour la génération vocale conversationnelle. Contrairement aux systèmes classiques de lecture de texte, Miso One vise à produire des échanges naturels dont le ton et le rythme s'adaptent au contexte. Sa caractéristique technique la plus frappante est sa latence annoncée de 110 millisecondes, soit moins que le temps de réaction humain moyen en conversation, estimé à 160 millisecondes. Le modèle propose également le clonage vocal à partir d'un extrait audio d'une dizaine de secondes, une fonctionnalité désormais courante dans le secteur mais rare dans les solutions ouvertes. Miso Labs a publié les poids du modèle dès son lancement, permettant aux développeurs de l'héberger eux-mêmes, de l'adapter ou de l'intégrer directement dans leurs applications. L'enjeu principal de ce lancement est de proposer une alternative crédible et souveraine aux API vocales propriétaires qui dominent le marché, comme celles d'ElevenLabs ou d'OpenAI. La possibilité d'héberger le modèle en local intéresse particulièrement les organisations traitant des données sensibles : secteur médical, financier ou administrations publiques, pour qui confier des données audio à des tiers représente un risque juridique et réglementaire réel. Sur le plan de l'expérience utilisateur, réduire la latence sous le seuil de perception humaine pourrait effacer l'une des dernières frictions qui trahissent encore les assistants vocaux, le silence artificiel entre question et réponse. Les premiers retours de testeurs publiés en ligne sont enthousiastes, certains affirmant avoir fait passer des voix générées pour des enregistrements humains auprès de proches. La synthèse vocale expressive est devenue un champ de bataille technologique majeur, tirée par l'essor des agents conversationnels et des interfaces vocales embarquées. Miso Labs s'inscrit dans un mouvement plus large de modèles open source qui cherchent à contester la domination des grandes plateformes américaines en rendant des capacités avancées accessibles sans abonnement ni dépendance à une API fermée. Cela dit, plusieurs zones d'ombre subsistent à ce stade : l'entreprise n'a pas publié la méthodologie précise derrière sa mesure de latence à 110 millisecondes, ni les conditions matérielles dans lesquelles ce chiffre a été obtenu. Aucune évaluation indépendante n'est encore venue valider les performances revendiquées en matière d'expressivité. Comme souvent dans l'industrie de l'IA, les annonces précèdent les benchmarks tiers, et Miso One devra passer l'épreuve des tests communautaires pour confirmer ses promesses.

UELes organisations européennes traitant des données audio sensibles (santé, finance, administrations publiques) pourraient adopter Miso One pour éliminer le risque juridique lié au transfert de données vers des API vocales tierces, en cohérence avec les obligations du RGPD.

💬 110 ms de latence sur un modèle open source auto-hébergeable, c'est le genre d'annonce qui mérite qu'on s'arrête deux secondes. Ce qui m'intéresse vraiment ici, c'est moins la perf brute que la possibilité de cloner une voix en local sans envoyer la moindre donnée audio à ElevenLabs ou OpenAI, ce qui débloque enfin la synthèse vocale pour le médical, le financier, les administrations, tout ce monde qui voulait se lancer mais bloquait sur le RGPD. Reste que le 110 ms sent le benchmark maison, et on attend les tests communautaires pour vraiment y croire.

CréationOpinion
1 source
Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public
58Le Big Data 

Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public

Google a lancé le 3 juin 2026 Gemma 4 12B, un modèle d'intelligence artificielle multimodal conçu pour fonctionner sur des ordinateurs grand public disposant de seulement 16 Go de mémoire vive. Contrairement aux grands modèles qui nécessitent des infrastructures cloud coûteuses, ce modèle intermédiaire de la famille Gemma est capable de traiter simultanément du texte, des images et de l'audio directement en local. Selon Google, ses performances sur plusieurs benchmarks se rapprochent de celles du modèle Gemma 26B, pourtant bien plus imposant. Le modèle est d'ores et déjà accessible via des outils populaires comme LM Studio, Ollama, les applications Google AI Edge Gallery et AI Edge Eloquent, ainsi qu'une interface en ligne de commande nommée LiteRT-LM. Les poids préentraînés sont disponibles sur Hugging Face et Kaggle. L'enjeu principal est la souveraineté des données et l'accessibilité de l'IA avancée. En permettant l'exécution locale d'un modèle multimodal capable de transcrire, reformater ou traduire du contenu vocal sans connexion internet, Google ouvre la voie à des cas d'usage concrets pour les professionnels et particuliers soucieux de ne pas envoyer leurs données vers des serveurs distants. L'analyse de documents, les assistants personnels et l'automatisation de tâches deviennent envisageables sur une machine ordinaire, sans abonnement cloud. C'est un changement de paradigme potentiellement significatif pour les entreprises de taille moyenne, les développeurs indépendants et les utilisateurs dans des environnements à connectivité limitée. Cette annonce s'inscrit dans une tendance de fond qui voit les grands acteurs de l'IA rivaliser sur le segment des modèles compacts et open, face à la montée de concurrents comme Meta avec Llama, Mistral ou encore Microsoft. La véritable originalité architecturale de Gemma 4 12B réside dans l'abandon des encodeurs séparés pour le traitement visuel et audio : au lieu d'assembler plusieurs briques spécialisées, le modèle intègre nativement ces modalités dans son réseau principal, réduisant les calculs intermédiaires et la consommation mémoire. Cette approche, techniquement délicate à mettre en oeuvre sans sacrifier les performances, représente aussi la première fois qu'un modèle intermédiaire de la gamme Gemma gère nativement l'audio. Google positionne ainsi Gemma 4 12B comme une brique de base pour des applications dites agentiques, capables d'agir de manière autonome sur l'appareil de l'utilisateur, un segment sur lequel la compétition entre laboratoires devrait s'intensifier dans les prochains mois.

UELes entreprises et développeurs européens peuvent désormais exécuter un modèle multimodal en local sans transférer leurs données vers des serveurs américains, une avancée directement pertinente pour la conformité RGPD.

💬 C'est le genre de modèle qu'on attendait : multimodal, 16 Go de RAM, dispo sur Ollama maintenant. L'audio natif sans encodeur séparé, c'est la vraie nouveauté technique, et ça change quelque chose pour qui veut traiter de la voix en local sans envoyer ses données quelque part. Reste à voir si les perfs tiennent dans les vrais usages, mais j'ai déjà lancé le pull.

LLMsOpinion
1 source
Claude Mythos arriverait enfin en Europe, mais la France n’attend pas les Américains pour s’armer contre les failles de sécurité
59Presse-citron 

Claude Mythos arriverait enfin en Europe, mais la France n’attend pas les Américains pour s’armer contre les failles de sécurité

Anthropic vient d'annoncer l'extension de son programme Claude Mythos à 15 nouveaux pays et 150 nouvelles organisations, dont la France. Parmi les entités désormais autorisées à utiliser cette intelligence artificielle de haute sécurité figurent des institutions stratégiques comme l'OTAN et l'ENISA, l'agence européenne chargée de la cybersécurité. Cette expansion marque une étape significative dans la diffusion de modèles d'IA américains vers les administrations et organisations sensibles du Vieux Continent. L'accès à Claude Mythos représente un enjeu majeur pour les institutions qui traitent des données confidentielles ou classifiées. Contrairement aux versions grand public de Claude, cette offre est conçue pour répondre aux exigences de souveraineté numérique et de sécurité que les gouvernements et agences de défense ne peuvent ignorer. Pour l'OTAN ou l'ENISA, disposer d'un outil d'IA puissant tout en maintenant un contrôle strict sur les données traitées constitue un avantage opérationnel direct dans un contexte de menaces cybernétiques croissantes. Cette ouverture intervient cependant dans un paysage où l'Europe n'attend pas les solutions américaines les bras croisés. Mistral, le champion français de l'IA, développe déjà des alternatives spécifiquement destinées aux banques et autres secteurs régulés qui ne peuvent ou ne souhaitent pas dépendre de technologies étrangères. La concurrence entre modèles américains souverainisés et modèles européens natifs illustre une tension plus large autour de l'autonomie stratégique numérique, question centrale pour les années à venir en matière de gouvernance de l'IA en Europe.

UEL'ENISA et l'OTAN intègrent Claude Mythos pour leurs opérations sensibles, ouvrant la voie à d'autres institutions françaises et européennes, tandis que Mistral positionne ses modèles souverains comme alternative pour les secteurs régulés.

💬 Que l'OTAN intègre Claude Mythos, bon, c'est dans la logique des choses, ils ont besoin d'outils qui tiennent en conditions réelles. Ce qui est plus intéressant, c'est que Mistral se positionne exactement en face pour les secteurs régulés, pas comme "aussi bien que les Américains", mais comme choix souverain assumé. Ce duel-là, c'est celui qu'il faut suivre.

SécuritéOpinion
1 source
☕️ Anthropic élargit l’accès à Mythos à une quinzaine de pays
60Next INpact 

☕️ Anthropic élargit l’accès à Mythos à une quinzaine de pays

Anthropic a annoncé l'élargissement de son projet Glasswing à plus de 150 organisations réparties dans plus de 15 pays, contre une présence initiale limitée aux États-Unis et au Royaume-Uni. Ce programme donne accès à un aperçu anticipé de Mythos, le modèle d'IA le plus ambitieux du laboratoire californien. Parmi les nouvelles organisations intégrées figurent des acteurs des secteurs de l'énergie, de la santé, des télécommunications et de la construction informatique, dont beaucoup gèrent des bases de données critiques dont dépendent d'autres organisations, gouvernements inclus. L'Union européenne pourrait également rejoindre le périmètre, selon Bloomberg, qui cite l'ENISA, l'agence européenne pour la cybersécurité, comme potentielle première bénéficiaire européenne, bien que Bruxelles n'ait pour l'instant rien confirmé officiellement. Cet élargissement n'est pas anodin sur le plan stratégique. Anthropic se retrouve à quelques encablures d'une introduction en Bourse, et Mythos constitue à la fois son produit phare et son meilleur argument de vente auprès d'investisseurs et de grandes organisations. En intégrant des secteurs d'infrastructures critiques dans le projet Glasswing, le laboratoire positionne Mythos comme un outil de niveau souverain, capable d'adresser des besoins que les modèles grand public ne peuvent pas satisfaire. L'accès reste délibérément restrictif : les candidats doivent justifier de leur sérieux avant d'être admis, ce qui entretient une image d'exclusivité et renforce la perception d'un outil puissant et contrôlé. Anthropic joue également sur la dimension sécuritaire pour asseoir son positionnement. Le laboratoire prévient que les modèles concurrents de "classe Mythos" attendus dans les six à douze prochains mois pourraient ne pas intégrer les mêmes garde-fous contre les usages malveillants, une façon d'installer la comparaison avant même que ces modèles n'existent. Cette rhétorique accompagne la mise en avant de Claude Security, un service reposant sur Claude Opus 4.8 pour analyser des bases de code et proposer des correctifs de sécurité. La manœuvre est transparente mais efficace : en distribuant Mythos à des organisations influentes dans des secteurs stratégiques, Anthropic crée des ambassadeurs institutionnels avant l'ouverture commerciale, tout en construisant un récit autour de la "responsabilité" qui distingue le labo de ses rivaux OpenAI et Google DeepMind dans la course aux modèles de nouvelle génération.

UEL'ENISA, agence européenne pour la cybersécurité, est citée comme potentielle première bénéficiaire européenne du programme Glasswing, ce qui pourrait marquer l'entrée d'un modèle d'IA américain de niveau souverain dans les infrastructures critiques de l'UE.

LLMsOpinion
1 source
☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google
61Next INpact 

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Alphabet, la maison mère de Google, a annoncé lundi 1er juin une levée de fonds de 80 milliards de dollars structurée en trois tranches distinctes. La première porte sur 30 milliards de dollars sous forme d'obligations convertibles en actions, la deuxième sur 40 milliards d'actions émises au prix du marché à partir du troisième trimestre 2026, et la troisième sur un placement privé de 10 milliards de dollars souscrit par Berkshire Hathaway, le conglomérat financier longtemps dirigé par Warren Buffett. Cette opération vise à financer l'expansion des infrastructures d'intelligence artificielle générative du groupe, dont le budget d'investissement est estimé entre 180 et 190 milliards de dollars pour la seule année 2026. Google précise par ailleurs avoir déjà contracté 85 milliards de dollars de dette bancaire en 2025, portant son encours total à plus de 100 milliards de dollars. Ce choix de recourir aux marchés financiers interpelle pour une entreprise valorisée 4 500 milliards de dollars en bourse et ayant généré 174 milliards de dollars de cash flow opérationnel en 2025. Mais la logique est industrielle : déployer un tel volume de capitaux sur ses seuls fonds propres fragiliserait la flexibilité financière du groupe et pèserait sur son bilan. En maintenant un endettement maîtrisé et en diluant légèrement ses actionnaires, Alphabet préserve sa capacité de manœuvre pour d'éventuelles acquisitions ou retournements de conjoncture. L'opération témoigne surtout de l'ampleur des investissements que requiert la course aux datacenters : même les géants les mieux capitalisés du secteur ne peuvent plus financer leur transformation IA sur leurs seules liquidités. Cette levée de fonds s'inscrit dans une dynamique sectorielle qui dépasse largement Google. Microsoft, Amazon et Meta multiplient eux aussi les montages financiers complexes pour accélérer leurs infrastructures, tandis qu'OpenAI, xAI et Anthropic lèvent des dizaines de milliards auprès d'investisseurs institutionnels et souverains. L'entrée de Berkshire Hathaway au capital d'Alphabet, même symbolique, marque une validation forte de la thèse IA par les investisseurs traditionnels les plus conservateurs. Côté fondamentaux, Google affiche une croissance de son chiffre d'affaires de 63 % en glissement annuel au premier trimestre 2026, avec un carnet de commandes ayant quasiment doublé en un trimestre pour dépasser 460 milliards de dollars, dont la moitié devrait être convertie en revenus dans les 24 prochains mois. L'IA est désormais moins un pari qu'une machine à commandes, mais une machine dont le coût d'alimentation oblige même les plus riches à emprunter.

UEL'écart croissant entre les capacités d'investissement dans les infrastructures IA américaines et européennes fragilise durablement la compétitivité du secteur technologique européen.

💬 Quand la boîte la mieux capitalisée du monde doit quand même aller sur les marchés, ça remet les chiffres à l'échelle : même 174 milliards de cash flow annuel ne tiennent plus le rythme des datacenters IA. L'entrée de Berkshire dans la danse, c'est la signature des derniers sceptiques institutionnels. Pour les acteurs européens qui regardent ça de loin, c'est le genre de chiffres qui fait mal à lire.

Anthropic ouvre Mythos à l’Europe : l’ENISA rejoint un club ultra-select
62Le Big Data 

Anthropic ouvre Mythos à l’Europe : l’ENISA rejoint un club ultra-select

Anthropic est en négociations avec l'Agence de l'Union européenne pour la cybersécurité (ENISA) pour lui accorder un accès à Mythos, son modèle d'intelligence artificielle spécialisé dans la cybersécurité. Selon le Financial Times, des représentants européens se sont récemment déplacés à San Francisco pour rencontrer Anthropic et discuter des modalités d'un éventuel accès au programme. Un porte-parole de l'ENISA a confirmé que des discussions étaient en cours, tout en précisant que rien n'était encore signé. Si elles aboutissent, ce serait la première extension significative de Mythos hors des États-Unis et du Royaume-Uni, seul pays non américain à avoir obtenu un accès officiel à ce jour. La Commission européenne semble également impliquée dans les échanges. Ces discussions s'inscrivent dans le cadre du projet Glasswing, une coalition lancée par Anthropic en avril 2026, regroupant principalement des entreprises américaines comme Microsoft, Apple, JPMorgan et CrowdStrike, qui utilisent Mythos pour détecter des failles de sécurité et renforcer leurs défenses numériques. L'enjeu est considérable pour l'Union européenne. Obtenir un accès à Mythos permettrait à l'ENISA de disposer d'un outil de pointe pour anticiper des menaces cyber émergentes et mieux évaluer les risques posés par les systèmes d'IA les plus avancés, une priorité affichée par les responsables européens. Pour les institutions de l'UE, c'est aussi une question de souveraineté numérique et d'influence technologique : rester en dehors du cercle Mythos signifierait laisser aux seules organisations anglo-saxonnes l'accès à une capacité défensive de premier plan dans un domaine où les cyberattaques gagnent chaque année en sophistication. La prudence d'Anthropic à l'égard de ce modèle s'explique précisément par ses capacités avancées : l'entreprise craint qu'un outil aussi puissant ne puisse être détourné à des fins offensives, ce qui justifie une sélection rigoureuse des partenaires. Depuis son lancement, Mythos est resté l'un des modèles d'IA les plus confidentiels du secteur, réservé à une poignée d'organisations jugées stratégiques et soumis à une évaluation préalable par des agences gouvernementales américaines. Cette rareté calculée reflète une stratégie délibérée d'Anthropic, qui entend peser sur les politiques de cybersécurité tout en contrôlant étroitement la diffusion d'une technologie à double usage. L'ouverture potentielle vers l'Europe intervient dans un contexte de rivalité technologique croissante entre les États-Unis et l'UE, cette dernière cherchant à ne pas dépendre exclusivement d'acteurs américains pour sa sécurité numérique. Si l'accord se concrétise, il pourrait ouvrir la voie à d'autres partenariats institutionnels européens et redéfinir les contours de la coopération transatlantique en matière d'IA appliquée à la cybersécurité.

UEL'ENISA pourrait obtenir un accès au modèle Mythos d'Anthropic, ce qui renforcerait les capacités défensives de l'UE face aux cybermenaces et réduirait sa dépendance envers les seuls acteurs anglo-saxons pour sa sécurité numérique.

SécuritéOpinion
1 source
NVIDIA lance DGX Station, un superordinateur IA sous Windows pour les entreprises
63Le Big Data 

NVIDIA lance DGX Station, un superordinateur IA sous Windows pour les entreprises

NVIDIA a dévoilé le 1er juin 2026, lors du GTC Taipei, la DGX Station pour Windows, présentée comme le superordinateur IA de bureau le plus puissant au monde. Propulsée par la puce GB300 Grace Blackwell Ultra Desktop Superchip, qui associe un GPU Blackwell Ultra à un processeur Grace de 72 cœurs via l'interconnexion NVLink-C2C, la machine offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops de performances en FP4. Elle peut exécuter localement des modèles d'intelligence artificielle atteignant 1 000 milliards de paramètres, et faire tourner plusieurs centaines d'agents IA simultanément. Commercialisée au quatrième trimestre 2026 par ASUS, Dell Technologies, MSI et Supermicro, la station intègre également une carte réseau ConnectX-8 SuperNIC à 800 Gbit/s, permettant d'interconnecter plusieurs unités entre elles pour des charges de travail encore plus exigeantes. L'enjeu central de cette annonce est de réconcilier la puissance des infrastructures de datacenter avec l'environnement Windows, dans lequel travaillent au quotidien la grande majorité des équipes en entreprise : développeurs, ingénieurs, data scientists, concepteurs 3D. Jusqu'ici, les projets IA les plus ambitieux reposaient quasi exclusivement sur des serveurs Linux hébergés dans le cloud ou dans des centres de données, créant un fossé entre les outils de production IA et les environnements de travail réels. Avec la DGX Station, NVIDIA cible directement ce décalage en permettant le développement, le test et le déploiement d'agents IA autonomes au plus près des applications métier, sans dépendance au cloud. Pour les organisations soucieuses de souveraineté des données, l'exécution locale des modèles permet aussi de limiter les transferts vers des infrastructures externes. Cette machine s'inscrit dans un tournant plus large de l'industrie : les entreprises ne cherchent plus seulement à intégrer des chatbots, mais à déployer des agents capables de raisonner, d'interagir avec plusieurs logiciels et d'automatiser des tâches complexes en continu. NVIDIA répond à cette demande en combinant la plateforme OpenShell, conçue pour construire et exécuter des agents sécurisés sous Windows, avec la densité de calcul de l'architecture Blackwell. La possibilité d'y coupler une carte RTX PRO 6000 Blackwell ajoute des capacités de visualisation et de simulation, élargissant encore le spectre des usages. Cette annonce confirme également la stratégie de NVIDIA de pénétrer l'entreprise non plus seulement par le datacenter, mais directement par le poste de travail, en faisant de la puissance de calcul IA une ressource locale, accessible et intégrée aux flux de travail existants.

UELes organisations européennes soumises au RGPD pourraient bénéficier de la capacité à exécuter localement des modèles d'IA volumineux, réduisant leur dépendance aux infrastructures cloud extra-européennes.

💬 20 pétaflops sur un bureau Windows, ça fait mal aux yeux. NVIDIA joue un coup malin : au lieu de vendre encore du datacenter, ils ramènent la puissance là où les équipes bossent au quotidien, sans passer par le cloud. Bon, la facture va être salée, mais pour une boîte avec des modèles sensibles et une DSI soucieuse du RGPD, c'est le premier argument solide.

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
64NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

Arthur Mensch : itinéraire d’un architecte de l’IA européenne
65Le Big Data 

Arthur Mensch : itinéraire d’un architecte de l’IA européenne

Arthur Mensch, 33 ans, a cofondé Mistral AI en mai 2023 à Paris aux côtés de Guillaume Lample et Timothée Lacroix, deux anciens de Meta AI et camarades de l'École Polytechnique. Dès le mois suivant, la jeune pousse lève 105 millions de dollars en amorçage auprès de Lightspeed Venture Partners, un record européen pour une entreprise sans produit visible, fondé uniquement sur la réputation scientifique des trois associés. Le parcours de Mensch lui-même est celui d'un chercheur de fond formé à Polytechnique, Télécom Paris et au Master MVA de l'ENS Paris-Saclay, avant une thèse à l'Inria et au CEA NeuroSpin sur l'optimisation stochastique appliquée à l'imagerie cérébrale. Il rejoint ensuite Google DeepMind Paris fin 2020, où il travaille pendant près de trois ans sur des architectures multimodales et du traitement du langage à grande échelle. Ce que représente Mistral AI dépasse le simple succès commercial d'une startup : c'est la première fois qu'une entreprise européenne s'installe durablement dans la compétition frontale avec OpenAI, Google et Meta sur les grands modèles de langage. En optant pour des modèles ouverts et publiés librement, Mistral bouscule un secteur où la fermeture est la norme, séduisant à la fois les développeurs indépendants, les entreprises soucieuses de souveraineté des données et les gouvernements européens en quête d'alternatives crédibles aux fournisseurs américains. Cette approche technique traduit aussi un pari stratégique : la transparence comme levier de confiance et d'adoption rapide. Le déclic entrepreneurial de Mensch est né d'un constat précis observé de l'intérieur de DeepMind : l'Europe produit des chercheurs en IA parmi les meilleurs au monde, mais la Silicon Valley en capte systématiquement la valeur économique et la propriété intellectuelle. Plutôt que de tenter d'infléchir cette dynamique depuis un grand groupe américain, il choisit de fonder une structure indépendante sur le continent, capable de retenir les talents locaux et de garantir que les données des utilisateurs européens ne transitent pas par des serveurs étrangers. Depuis ses auditions parlementaires à Bruxelles et Paris, Mensch porte désormais ce discours au niveau politique, plaidant pour une régulation de l'IA qui ne pénalise pas les acteurs européens face à des concurrents qui opèrent hors de toute contrainte comparable. En trois ans, Mistral est passé de feuille blanche à symbole d'une souveraineté technologique possible.

UEMistral AI, entreprise purement française, incarne la souveraineté technologique européenne en offrant aux entreprises et gouvernements du continent une alternative crédible aux modèles américains pour héberger leurs données sans dépendance extra-européenne.

💬 105 millions levés sans produit, juste sur la réputation de trois chercheurs : ça te dit tout sur ce que vaut la crédibilité scientifique quand elle est bien emballée. Ce que Mensch a compris (et que DeepMind n'a pas su retenir), c'est que garder les talents ici passe par leur donner la propriété de ce qu'ils construisent. L'open source comme levier d'adoption, c'est le pari qui a marché jusqu'ici.

BusinessOpinion
1 source
DeepSeek V4 : émancipation chinoise et urgence d’une stratégie IA européenne
66Le Big Data 

DeepSeek V4 : émancipation chinoise et urgence d’une stratégie IA européenne

Le modèle DeepSeek V4, développé par la startup chinoise DeepSeek, s'est imposé comme un signal fort de la maturité technologique de la Chine en matière d'intelligence artificielle. Dans une analyse publiée début 2026, Francis Lelong, expert en souveraineté technologique, décortique les mécanismes qui ont permis à Pékin de contourner les sanctions américaines sur les semi-conducteurs. Loin de freiner Pékin, ces restrictions ont fonctionné comme un accélérateur : privée d'accès direct aux puces Nvidia haut de gamme, la Chine a investi massivement dans sa propre chaîne de valeur, des terres rares aux modèles de langage, en passant par la conception de ses propres composants. Le résultat est un écosystème d'IA de plus en plus autonome, capable de proposer des LLM ouverts et paramétrables compétitifs face aux offres américaines, à l'image de ce que Mistral AI incarne en Europe. L'enjeu dépasse largement la performance technique des chatbots. Lelong rappelle qu'un modèle d'IA n'est jamais culturellement neutre : il encode les valeurs, les biais et les priorités politiques de ses concepteurs. La montée en puissance de l'IA chinoise représente donc un levier de soft power considérable, capable d'exporter une vision du monde à travers chaque interaction. Sur le plan économique, l'ouverture de data centers est comparée par Lelong à un déploiement instantané de "millions de cerveaux synthétiques" : dans un contexte de vieillissement démographique mondial, le travail synthétique déplace la valeur du capital humain et devient un moteur de croissance incontournable pour éviter la stagnation. La compétition sino-américaine profite paradoxalement aux entreprises mondiales, qui bénéficient d'une offre élargie et de coûts réduits. Cette course technologique s'inscrit dans une rivalité géopolitique structurelle, comparable à la course spatiale des années 1960, mais avec une dimension culturelle et économique bien plus diffuse. Les sanctions américaines, selon Lelong, ne feront que retarder l'inévitable : la Chine avait déjà tracé sa trajectoire d'indépendance technologique, couvrant le spatial, le quantique, l'énergie et le nucléaire. L'affaire Manus, où Pékin a repris le contrôle d'une startup acquise par Meta, est interprétée non comme un acte de souveraineté assumée, mais comme un signal inquiétant envoyé aux jeunes talents et aux investisseurs. C'est dans ce contexte que l'Europe est interpellée dans son absence stratégique : ni le modèle fermé et capitalistique américain, ni le modèle ouvert mais politiquement contrôlé chinois ne correspond aux valeurs européennes. Définir une troisième voie, à l'image du succès relatif de Mistral, reste l'urgence que Lelong juge encore sans réponse collective à l'échelle du continent.

UELa montée en puissance de DeepSeek et de l'IA chinoise renforce l'urgence pour l'Europe de définir une troisième voie souveraine, Mistral restant pour l'instant la seule réponse partielle à l'échelle du continent.

💬 Les sanctions américaines censées bloquer Pékin leur ont offert le meilleur des accélérateurs : construire leur propre chaîne, du silicium au modèle. Pendant ce temps, l'Europe a Mistral et beaucoup de colloques sur la souveraineté numérique. C'est pas faute d'avoir été prévenus.

LLMsReglementation
1 source
De l’IA générative à l’ingénierie industrielle : le nouveau pari de MISTRAL AI
67FrenchWeb 

De l’IA générative à l’ingénierie industrielle : le nouveau pari de MISTRAL AI

Mistral AI a choisi le cadre du Carrousel du Louvre, à Paris, pour tenir son événement « AI Now Summit » et annoncer un tournant stratégique majeur : la startup française se repositionne activement vers l'ingénierie industrielle. Plutôt que de rester cantonnée aux assistants conversationnels et aux outils de bureautique, l'entreprise fondée en 2023 affiche désormais l'ambition de pénétrer les secteurs manufacturiers, énergétiques et d'infrastructure, là où les besoins en automatisation complexe sont les plus pressants. Ce pivot représente un changement de cible commercial significatif. L'industrie offre des contrats pluriannuels à forte valeur, des données propriétaires difficiles à répliquer et une dépendance technologique bien plus forte que dans le grand public. Pour Mistral, s'imposer dans des processus critiques, maintenance prédictive, optimisation de chaînes de production, aide à la conception d'équipements, ouvre un marché estimé à plusieurs centaines de milliards d'euros à l'échelle mondiale, largement sous-adressé par les acteurs américains. Mistral AI s'inscrit ainsi dans une logique de différenciation face à OpenAI et Google, qui dominent le segment grand public et les outils de productivité. La startup lève depuis 2023 des montants considérables, plus d'un milliard d'euros au total, et bénéficie du soutien politique français pour incarner une alternative européenne souveraine à l'IA américaine. Le virage industriel, plus exigeant techniquement mais potentiellement plus défensible commercialement, pourrait être la clé de sa pérennité à long terme dans un marché en consolidation rapide.

UEMistral AI, fleuron français soutenu politiquement, cible les secteurs industriels européens (énergie, manufacture, infrastructure) en se positionnant comme alternative souveraine aux solutions américaines d'OpenAI et Google.

💬 Sortir du grand public face à OpenAI, c'est pas fuir, c'est choisir le terrain. L'industrie paie en contrats pluriannuels, ses données sont propriétaires, et personne ne change de fournisseur critique sur un coup de tête. La vraie question, c'est pas le marché, c'est si Mistral a les équipes pour tenir quand ça bug en prod à 3h du mat.

Mistral rejoint Harvey pour les usages IA en entreprise
68Le Big Data 

Mistral rejoint Harvey pour les usages IA en entreprise

Harvey, la plateforme d'intelligence artificielle dédiée au secteur juridique, a officialisé le 26 mai 2026 un partenariat avec Mistral AI pour intégrer les modèles de la startup française à son environnement multi-modèles. Ce lancement cible en priorité les clients européens de Harvey, dont la plateforme permet déjà aux cabinets d'avocats et directions juridiques d'automatiser des tâches complexes : analyse contractuelle, recherche documentaire, synthèse de dossiers, assistance à la rédaction. L'ajout de Mistral enrichit ce dispositif en proposant une couche supplémentaire de personnalisation, notamment grâce aux capacités multilingues de la startup française, sa gestion des contextes longs et son efficacité d'exécution sur de grands volumes de documents multi-juridictions. Harvey précise que ce déploiement accompagne l'ouverture récente de son bureau parisien et le renforcement de ses investissements en France et dans l'Union européenne. Ce partenariat répond à une évolution profonde des attentes des grandes entreprises vis-à-vis de l'IA générative. Transparence des modèles, localisation des données, conformité réglementaire et gouvernance ne sont plus des options mais des critères décisifs, en particulier dans des secteurs sensibles comme le droit. Les modèles Mistral sont reconnus pour leur approche "open-weight", qui offre une visibilité accrue sur le fonctionnement et l'évaluation des systèmes, un atout de poids pour des organisations soumises à des obligations strictes en matière de sécurité et de conformité. Harvey ne cherche pas à remplacer un fournisseur d'IA par un autre : sa plateforme est conçue pour sélectionner automatiquement le modèle le plus adapté à chaque tâche, construisant ainsi une architecture résiliente et performante pour ses clients entreprises. Ce mouvement s'inscrit dans un contexte plus large de souveraineté technologique en Europe, où les acteurs locaux comme Mistral gagnent rapidement en crédibilité face aux géants américains. Les entreprises européennes ne se contentent plus de chercher les modèles les plus puissants : elles veulent savoir où transitent leurs données, quels modèles les traitent et dans quelles conditions ces systèmes sont déployés. Harvey, dont la plateforme multi-modèles inclut déjà des solutions de plusieurs grands fournisseurs, positionne Mistral comme la réponse naturelle aux exigences du marché européen. Le partenariat marque ainsi une étape dans la stratégie d'expansion européenne de l'éditeur américain, tout en consolidant la place de Mistral comme acteur incontournable de l'IA d'entreprise sur le Vieux Continent.

UELe déploiement de Mistral chez Harvey cible directement les clients européens du secteur juridique, renforçant la souveraineté technologique de l'UE en offrant aux cabinets d'avocats et directions juridiques européens un modèle français conforme RGPD et AI Act pour traiter leurs données sensibles.

💬 Mistral dans le juridique, c'était couru d'avance. Un cabinet d'avocats qui traite des dossiers clients via GPT-4 sur des serveurs américains, ça fait frémir les RSSI, donc là l'argument souveraineté pèse vraiment. Harvey a pigé que pour exister en Europe, il fallait jouer cette carte.

BusinessOpinion
1 source
« Le vrai danger n’est pas l’IA » : l’aveu fracassant du pape dans sa 1ère encyclique
69Le Big Data 

« Le vrai danger n’est pas l’IA » : l’aveu fracassant du pape dans sa 1ère encyclique

Le pape Léon XIV a publié sa toute première encyclique, intitulée "Magnifica humanitas", consacrée en grande partie à l'intelligence artificielle. C'est une première dans l'histoire de l'Église catholique : un souverain pontife qui place la technologie au cœur de son premier grand texte doctrinal. Le document ne condamne pas l'IA en elle-même, mais pointe avec précision les risques systémiques qu'elle engendre : concentration du pouvoir technologique entre les mains d'une minorité d'entreprises et de gouvernements, développement d'armes autonomes capables d'agir sans décision humaine, surveillance numérique généralisée, et réduction de l'individu à sa seule productivité mesurable. Léon XIV formule une position claire : la valeur d'un être humain n'est pas fonction de son efficacité ni de ses données, et aucun algorithme ne peut en décider autrement. L'impact de ce texte dépasse largement les fidèles catholiques. En prenant position sur la régulation de l'IA, le pape entre dans un débat qui mobilise gouvernements, institutions multilatérales et société civile depuis plusieurs années. Sa critique du "paradigme technocratique", cette tendance à tout soumettre à la logique de performance et de profit, rejoint des préoccupations portées par des économistes, des philosophes et des juristes. Sur les inégalités, l'encyclique est particulièrement directe : si l'accès aux outils d'IA reste concentré dans les pays riches et entre les mains de quelques groupes, les écarts existants ne feront que se creuser. Le pape réclame une régulation publique, des contrôles indépendants et des règles éthiques communes, en insistant sur le fait qu'une IA "morale" n'a aucune valeur si cette morale est définie par une poignée d'acteurs privés. L'encyclique s'inscrit dans un contexte de montée en puissance des débats sur la gouvernance de l'IA à l'échelle mondiale, entre l'AI Act européen, les négociations à l'ONU et les initiatives nationales des États-Unis et de Chine. Léon XIV, élu en mai 2025, avait déjà signalé lors de son élection qu'il entendait inscrire son pontificat dans les questions sociales contemporaines. Son texte aborde également la surveillance algorithmique des plateformes numériques, qu'il décrit comme une "architecture de la visibilité" favorisant la polarisation et l'uniformisation des opinions. Sur le volet militaire, il rejette explicitement les systèmes d'armes létales autonomes, estimant que la distance technologique entre le combattant et sa victime banalise la violence plutôt qu'elle ne la contient. La suite dépendra de la réception du texte par les États membres de l'ONU et les grandes puissances technologiques, aucune d'entre elles n'étant directement liée par la doctrine pontificale, mais toutes attentives au poids symbolique et diplomatique d'une telle prise de position.

UEL'encyclique s'inscrit explicitement dans le contexte de l'AI Act européen et des négociations à l'ONU, et pourrait peser sur l'opinion publique en faveur d'une régulation plus stricte dans les États membres à majorité catholique.

💬 Le texte ne surprend pas vraiment sur le fond, des économistes et des juristes disent ça depuis des années. Mais le poids symbolique d'une encyclique, c'est autre chose : 1,3 milliard de catholiques ont maintenant un cadre doctrinal qui classe la concentration du pouvoir techno parmi les problèmes moraux, pas juste politiques. Je vois ça comme un levier inattendu pour les régulateurs européens, et une migraine diplomatique de plus pour les grands groupes.

ÉthiqueReglementation
1 source
Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100
70MarkTechPost 

Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100

Cohere a publié Command A+, un modèle open source sous licence Apache 2.0 conçu pour les workflows agentiques en entreprise. Architecturé comme un Transformer sparse Mixture-of-Experts (MoE) décodeur uniquement, le modèle totalise 218 milliards de paramètres mais n'en active que 25 milliards par inférence, grâce à un mécanisme de routage vers 8 experts parmi 128 disponibles. Cette architecture permet de faire tourner Command A+ sur seulement deux GPU H100 en quantification W4A4 4 bits, ou sur quatre H100 en FP8, rendant le déploiement on-premise accessible sans infrastructure exorbitante. Le modèle prend en charge une fenêtre de contexte de 128 000 tokens, génère jusqu'à 64 000 tokens, traite texte, images et appels d'outils, et couvre désormais 48 langues contre 23 pour ses prédécesseurs. Il fusionne en un seul modèle les capacités de quatre modèles précédents : Command A, Command A Reasoning, Command A Vision et Command A Translate. Les gains de performance sont substantiels. Sur le benchmark tau²-Bench Telecom, Command A+ passe de 37 % à 85 % par rapport à Command A Reasoning. Sur Terminal-Bench Hard, référence pour le codage agentique difficile, le score bondit de 3 % à 25 %. En interne, Cohere mesure une amélioration de 20 % en question-réponse agentique, de 32 % en analyse de tableurs, et la capacité à exploiter la mémoire de sessions précédentes atteint 54 % contre 39 %. Sur le plan multimodal, MathVista progresse de 73,5 % à 80,6 % et Command A+ décroche 37 points sur l'Artificial Analysis Intelligence Index, devançant les principaux modèles open source concurrents. La quantification W4A4, appliquée uniquement aux couches MoE tout en conservant les projections d'attention en pleine précision, n'entraîne aucune dégradation mesurable sur les benchmarks et améliore le débit de sortie de 63 % tout en réduisant le temps avant premier token de 17 % par rapport à Command A Reasoning. Command A+ s'inscrit dans une tendance de fond qui voit les grands laboratoires chercher à réduire drastiquement le coût d'inférence sans sacrifier la qualité. Cohere, positionné historiquement sur le segment entreprise face à OpenAI, Anthropic et Google, mise sur la portabilité et la souveraineté des déploiements : la licence Apache 2.0 permet un usage commercial libre, un argument de poids pour les organisations qui refusent de dépendre de fournisseurs cloud. La technique de distillation avec prise en compte de la quantification (Quantization-Aware Distillation) utilisée en post-entraînement illustre la maturité croissante des méthodes de compression, qui commencent à rivaliser avec les modèles denses pleine précision sur des tâches complexes. La prochaine question sera de savoir si des performances agentiques aussi élevées sur deux H100 suffiront à convaincre les DSI d'internaliser leurs inférences plutôt que de passer par les API managées.

UELa licence Apache 2.0 et la possibilité de déployer Command A+ sur seulement deux GPU H100 ouvrent aux entreprises européennes une option d'inférence on-premise souveraine, réduisant leur dépendance aux APIs cloud américaines.

LLMsOpinion
1 source
Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI
71Le Big Data 

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

Mistral AI a annoncé l'acquisition d'Emmi AI, une startup autrichienne fondée à Linz et spécialisée dans la modélisation de phénomènes physiques complexes, flux d'air, transfert thermique, contraintes mécaniques sur les matériaux. Le montant de la transaction n'a pas été divulgué, mais l'opération est considérée comme l'une des plus significatives de l'écosystème européen de l'IA cette année. Emmi AI avait levé 15 millions d'euros en 2025, la plus importante levée de fonds jamais réalisée en Autriche dans le secteur de l'intelligence artificielle. Ses équipes, réparties entre l'Autriche, l'Allemagne et la Lituanie, rejoignent désormais Mistral. La société française prévoit d'ouvrir un bureau officiel à Linz, qui s'ajoutera à ses hubs existants à Paris, Londres et Munich. Cette acquisition donne à Mistral AI une capacité inédite en Physics AI, des modèles capables de comprendre et simuler le comportement du monde physique en temps réel. Pour les industriels des secteurs des semi-conducteurs, de l'automobile ou de l'aérospatiale, cela ouvre la voie à des jumeaux numériques plus précis, à des simulations accélérées et à une réduction significative des coûts de R&D. Mistral dispose déjà de modèles analysant les lignes de production pour détecter des défauts ou piloter des bras robotisés ; l'intégration des technologies d'Emmi doit rendre ces systèmes plus fiables dans leurs interactions avec des environnements physiques contraignants. L'enjeu est aussi de proposer aux industriels européens une alternative souveraine aux plateformes américaines, dont la dépendance est de plus en plus perçue comme un risque stratégique. Le rachat s'inscrit dans un contexte de montée en puissance de l'IA industrielle comme priorité politique en Europe. La Commission européenne considère le secteur manufacturier comme un pilier de sa stratégie d'autonomie technologique, et plusieurs États membres accélèrent leurs investissements dans ce domaine. Mistral AI, valorisé à plusieurs milliards d'euros après ses dernières levées de fonds, consolide ainsi son positionnement face aux géants américains comme Google, Microsoft ou OpenAI, qui investissent massivement dans les mêmes usages verticaux. En s'ancrant davantage en Europe centrale avec des engagements en Autriche, en Allemagne et en Lituanie, le groupe français envoie un signal clair : la compétition pour l'IA industrielle se jouera aussi sur la capacité à retenir les talents et à construire des infrastructures de recherche hors des États-Unis.

UEL'acquisition d'Emmi AI par Mistral AI renforce la souveraineté technologique européenne dans l'IA industrielle, avec l'ouverture d'un bureau à Linz et l'intégration d'équipes autrichiennes, allemandes et lituaniennes au sein d'un champion français.

💬 Mistral qui bascule dans la simulation physique, c'est un vrai pari industriel, pas juste du repositionnement marketing. Modéliser des flux d'air ou des contraintes thermiques en temps réel, ça vaut des millions d'euros de tests physiques évités pour un constructeur auto ou un fabricant de semi-conducteurs. L'intégration va être compliquée, mais si ça marche, c'est un avantage que ni OpenAI ni Google n'ont encore vraiment.

BusinessOpinion
1 source
IA et performance : le verdict de l’indice mondial Fivetran
72Le Big Data 

IA et performance : le verdict de l’indice mondial Fivetran

Fivetran a publié en 2026 son indice mondial de maturité des pipelines de données, et les résultats sont sans appel : si 60 % des organisations à l'échelle mondiale investissent massivement dans l'IA agentique, avec des budgets estimés à plusieurs dizaines de millions d'euros, seules 15 % d'entre elles disposent réellement d'une infrastructure de données suffisamment solide pour faire fonctionner ces systèmes en production. En France, ce chiffre tombe à 12 %, soit parmi les plus faibles des pays étudiés. George Fraser, PDG de Fivetran, pointe une erreur de diagnostic commune : les entreprises investissent dans les modèles et les interfaces, mais négligent la plomberie informatique qui les alimente. Résultat : des agents autonomes déployés sur des pipelines instables, incapables de fournir des données fiables en temps réel. L'enjeu dépasse largement la performance technique. Contrairement à l'IA générative classique qui produit du texte à la demande, l'IA agentique prend des décisions et exécute des tâches en autonomie, ce qui exige une traçabilité complète et des données de qualité à chaque instant. Or, près de 40 % des professionnels interrogés dans l'étude identifient deux blocages majeurs : l'absence de traçabilité, qui empêche de comprendre l'origine des erreurs quand un agent dérape, et les contraintes réglementaires de souveraineté des données, qui freinent les déploiements à grande échelle. Ces failles de gouvernance transforment les projets pilotes en impasses opérationnelles, avec des risques économiques et réputationnels concrets pour les organisations concernées. Gartner va plus loin en avertissant que plus de la moitié des initiatives d'IA agentique pourraient être abandonnées faute de préparation adéquate des systèmes sous-jacents. Ce rapport intervient dans un contexte d'accélération généralisée des budgets IA, où la pression sur les directions informatiques pour livrer des résultats visibles est maximale. Les entreprises les plus avancées dans leur déploiement partagent une caractéristique commune : elles ont misé sur des architectures interopérables, capables de communiquer entre différents systèmes sans dépendre d'un fournisseur unique, ce que l'industrie appelle l'évitement du "vendor lock-in". Pour les responsables data, cette capacité d'intégration est désormais un critère éliminatoire dans le choix des solutions. La leçon que tire Fivetran de cet indice est claire : la priorité de 2026 n'est plus l'acquisition de nouveaux outils d'IA, mais la consolidation et la fiabilisation des flux de données qui les alimentent. Sans cette fondation, les ambitions agentiques resteront, pour la plupart des organisations, des promesses sur slides.

UELa France affiche le taux de maturité infrastructure le plus bas de l'étude (12%), exposant les entreprises françaises à un risque élevé d'échec de leurs initiatives d'IA agentique faute de pipelines de données fiables.

InfrastructureActu
1 source
Amazon SageMaker AI prend en charge l'API compatible OpenAI
73AWS ML Blog 

Amazon SageMaker AI prend en charge l'API compatible OpenAI

Amazon a annoncé ce mois-ci que SageMaker AI supporte désormais une API compatible avec celle d'OpenAI pour ses endpoints d'inférence en temps réel. Concrètement, les développeurs qui utilisent le SDK OpenAI, LangChain ou le framework Strands Agents peuvent désormais router leurs appels vers des modèles hébergés sur SageMaker AI en changeant uniquement l'URL de l'endpoint. Plus besoin de client personnalisé, de wrapper SigV4, ni de réécriture de code. Les endpoints SageMaker exposent un chemin /openai/v1 qui accepte les requêtes au format Chat Completions et renvoie les réponses du conteneur telles quelles, y compris en streaming. L'authentification repose sur des tokens bearer à durée limitée (jusqu'à 12 heures), générés à partir des credentials AWS existants via le SDK Python SageMaker, sans clé API supplémentaire. Ce changement simplifie radicalement l'intégration de SageMaker dans les stacks d'IA existantes. Pour les équipes qui orchestrent des agents multi-LLM via une gateway (comme Bifrost, mentionnée par Giorgio Piatti, ingénieur ML chez Caffeine.AI), SageMaker devient un fournisseur interchangeable sans adaptation technique. Les cas d'usage sont nombreux : workflows agentiques tournant entièrement sur de l'infrastructure dédiée en compte AWS, hébergement multi-modèles sur un seul endpoint via les inference components (par exemple Llama pour les tâches générales, un Mistral fine-tuné pour un domaine métier, et un petit modèle de classification), ou encore déploiement de modèles open source fine-tunés sans toucher au code applicatif existant. Pour les entreprises soumises à des contraintes de souveraineté des données ou de conformité, c'est un gain concret : elles peuvent utiliser les mêmes frameworks standardisés OpenAI tout en gardant les modèles dans leur propre compte AWS. Cette annonce s'inscrit dans une bataille plus large pour capter les workloads d'inférence IA en entreprise. Le standard OpenAI s'est imposé de facto comme protocole universel pour les LLMs, et les grands fournisseurs cloud (AWS, Google, Azure) cherchent à réduire les frictions pour attirer des équipes déjà investies dans cet écosystème. Amazon avait déjà investi massivement dans Bedrock et SageMaker, mais l'adoption restait freinée par les incompatibilités d'API qui forçaient les migrations de code. En adoptant la compatibilité OpenAI directement au niveau de SageMaker AI, AWS ferme cet écart et concurrence frontalement des solutions comme Azure OpenAI Service ou les endpoints Vertex AI de Google. Le notebook d'exemple avec Qwen3-4B (modèle d'Alibaba disponible sur Hugging Face) illustre aussi l'ouverture vers les modèles open source, un segment en forte croissance face aux modèles propriétaires.

UELes entreprises européennes soumises aux contraintes RGPD et de souveraineté des données peuvent désormais utiliser les frameworks OpenAI standard tout en maintenant leurs modèles dans leur propre infrastructure AWS hébergée en région européenne.

💬 C'est le genre de truc qui semble anodin et qui change tout en pratique. Changer juste l'URL pour basculer d'OpenAI vers SageMaker, sans toucher au code, c'est exactement ce que les équipes enterprise attendaient pour switcher sans se battre avec leur DSI. Bon, ça reste AWS, donc la facture peut vite grimper, mais pour les boîtes avec des contraintes de souveraineté data, l'argument est solide.

OutilsOpinion
1 source
AION : la gigafactory IA d'Orange, EDF et Capgemini
74FrenchWeb 

AION : la gigafactory IA d'Orange, EDF et Capgemini

Ardian, Orange, EDF, Capgemini, Artefact, Bull, le Groupe iliad et Scaleway ont annoncé leur regroupement au sein du consortium AION pour déposer une candidature française au programme européen des AI Gigafactories. Cette initiative, portée par la Commission européenne dans le cadre de son agenda pour la souveraineté numérique, vise à financer la construction de centres de calcul massifs dédiés à l'intelligence artificielle sur le sol européen. L'alliance réunit ainsi des acteurs complémentaires : un fonds d'investissement de premier plan, deux géants de l'énergie et des télécoms, un intégrateur IT mondial et plusieurs spécialistes du cloud français. L'enjeu est considérable pour l'écosystème européen de l'IA. L'Europe accuse un retard structurel face aux États-Unis et à la Chine en matière de puissance de calcul disponible pour entraîner et faire tourner des grands modèles de langage. Une gigafactory labellisée par Bruxelles permettrait de concentrer des milliers de GPU sur un même site, d'en garantir l'accès à des startups et laboratoires de recherche européens à des conditions compétitives, et de réduire la dépendance aux infrastructures américaines comme AWS ou Azure. Le programme AI Gigafactories s'inscrit dans le plan InvestAI annoncé par la Commission européenne début 2025, qui ambitionne de mobiliser 200 milliards d'euros pour rattraper le retard du continent. Plusieurs États membres ont déjà soumis des candidatures, et la France entend peser dans cette compétition en fédérant ses acteurs industriels et technologiques les plus solides. Le choix des lauréats par Bruxelles déterminera quels pays accueilleront les prochains piliers de l'infrastructure IA continentale.

UELe consortium AION réunit Orange, EDF, Capgemini, iliad et Scaleway pour candidater au programme européen des AI Gigafactories, ce qui pourrait permettre à la France d'accueillir un centre de calcul souverain offrant aux startups et laboratoires européens un accès compétitif à la puissance GPU nécessaire à l'entraînement de grands modèles.

💬 Du lourd dans ce consortium : Orange, EDF, Scaleway, iliad, c'est pas une candidature symbolique. Ce qui m'intéresse vraiment là-dedans, c'est pas la gigafactory en elle-même, c'est l'accès GPU garanti pour les startups et labos européens qui galèrent à se payer du compute H100. Bruxelles retient 2-3 sites max sur tout le continent, et là, faut pas se louper.

InfrastructureActu
1 source
Codex en local : OpenAI et Dell pour l'entreprise
75Le Big Data 

Codex en local : OpenAI et Dell pour l'entreprise

OpenAI et Dell Technologies ont annoncé le 18 mai 2026 un partenariat stratégique visant à déployer Codex, l'agent de développement logiciel d'OpenAI, directement dans les infrastructures sur site et hybrides des grandes entreprises. Concrètement, Codex sera connecté à la Dell AI Data Platform, la couche de stockage et de gouvernance de données que de nombreuses organisations utilisent pour gérer leurs actifs numériques en interne. Ce déploiement permettra aux agents IA d'accéder aux bases de code internes, à la documentation technique et aux workflows métiers sans que les données sensibles ne quittent l'infrastructure de l'entreprise. Codex compte aujourd'hui plus de 4 millions de développeurs actifs chaque semaine, ce qui en fait l'un des produits professionnels à la croissance la plus rapide du portefeuille OpenAI. Au-delà de l'assistance au développement logiciel, les entreprises l'utilisent déjà pour automatiser des revues de code, améliorer la couverture de tests, gérer des incidents techniques, générer des rapports ou encore router des feedbacks produits. Ce partenariat lève un frein majeur à l'adoption de l'IA générative dans les grandes organisations : la résistance à exposer des données sensibles vers le cloud public. Les secteurs de la finance, de la santé, de l'industrie et des infrastructures critiques maintiennent des architectures hybrides précisément pour conserver le contrôle total sur leurs actifs stratégiques. En permettant à Codex d'opérer au plus proche de ces données, OpenAI et Dell répondent directement aux contraintes de sécurité, de conformité réglementaire et de gouvernance qui bloquaient jusqu'ici les déploiements à grande échelle. Pour les équipes techniques, cela signifie concrètement pouvoir intégrer des agents IA dans des workflows critiques sans compromis sur la souveraineté des données. Ce mouvement s'inscrit dans une tendance de fond : après la phase d'expérimentation, le marché de l'IA en entreprise entre dans une phase de déploiement industriel. OpenAI, qui a longtemps été perçu comme un acteur cloud-first, cherche à ne pas perdre les grands comptes au profit de solutions souveraines ou de modèles open source déployables en local. Dell, de son côté, repositionne son infrastructure AI Factory comme une couche d'intégration incontournable entre les modèles fondateurs et les systèmes d'information d'entreprise. Le partenariat entre les deux groupes illustre une recomposition plus large du marché, où les fournisseurs de matériel et de cloud hybride deviennent des intermédiaires stratégiques pour l'adoption de l'IA dans les environnements réglementés. Les prochains mois diront si ce modèle de distribution peut convaincre les secteurs les plus prudents à franchir le pas.

UELes entreprises françaises et européennes des secteurs régulés (finance, santé, industrie) peuvent désormais envisager d'intégrer Codex dans leurs infrastructures on-premise sans exposer leurs données au cloud public, levant un frein majeur à l'adoption de l'IA générative dans des environnements soumis au RGPD et aux exigences de souveraineté numérique.

💬 C'est OpenAI qui recule, pas Dell qui avance. Les grands comptes ont refusé d'envoyer leur code source en cloud public, et plutôt que de perdre ce marché au profit de Llama ou Mistral déployables en local, OpenAI a choisi de plier. Reste à voir si ça tient dans les environnements les plus contraints, genre la DSI d'une banque française sous ACPR.

OutilsOpinion
1 source
Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI
76FrenchWeb 

Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI

Mistral AI, la startup parisienne fondée en 2023 et valorisée plus de six milliards d'euros, annonce l'acquisition d'Emmi AI, une société spécialisée dans les agents conversationnels d'entreprise. Cette opération s'inscrit dans une stratégie de diversification accélérée : plutôt que de se limiter à l'entraînement de modèles fondationnels, Mistral cherche à construire une offre verticalement intégrée, allant du modèle de base jusqu'aux applications déployées chez les clients. Les détails financiers de l'acquisition n'ont pas été rendus publics. L'enjeu est de taille pour l'écosystème européen. Les entreprises du continent restent largement dépendantes des hyperscalers américains (AWS, Azure, Google Cloud) pour leurs infrastructures, des GPU NVIDIA pour le calcul, et des modèles d'OpenAI, Anthropic ou Google pour l'inférence. En absorbant Emmi AI, Mistral tente de proposer une alternative souveraine complète aux directions informatiques européennes soucieuses de leur autonomie stratégique et de conformité réglementaire, notamment au regard de l'AI Act européen entré en vigueur en 2024. Ce rachat intervient alors que la compétition internationale s'intensifie sur deux fronts simultanés : les États-Unis maintiennent leur avance sur les modèles de pointe, tandis que la Chine rattrape son retard à marche forcée avec des architectures intégrées comme celles de Huawei ou Baidu. Pour Mistral, qui a levé 1,1 milliard de dollars en 2024 avec des investisseurs comme Andreessen Horowitz et la Banque publique d'investissement, l'heure est au passage à l'échelle commerciale, pas seulement technologique.

UEL'acquisition d'Emmi AI par Mistral AI renforce l'offre souveraine européenne en agents IA d'entreprise, donnant aux DSI françaises et européennes une alternative intégrée aux solutions américaines, dans un contexte de conformité à l'AI Act.

💬 Mistral fait le pari qu'un modèle de base, ça ne suffit plus. Racheter Emmi AI, c'est aller chercher le client là où il est, dans ses workflows d'entreprise, plutôt que d'attendre qu'il vienne lui-même sur une API. Reste à voir si une startup, même avec un milliard en caisse, peut tenir tête aux hyperscalers sur leur propre terrain.

BusinessOpinion
1 source
SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP
77Le Big Data 

SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP

Lors de SAP Sapphire 2026, l'éditeur allemand SAP a présenté sa nouvelle vision stratégique : transformer son ERP en une "entreprise autonome" capable d'exécuter des processus critiques de bout en bout grâce à l'IA. Le CEO Christian Klein a dévoilé trois piliers majeurs : SAP Autonomous Suite, qui déploie plus de 50 assistants Joule spécialisés coordonnant plus de 200 agents IA dans la finance, les achats, la supply chain, les RH et l'expérience client ; SAP Business AI Platform, qui fusionne SAP Business Technology Platform, SAP Business Data Cloud et SAP Business AI en un environnement unique ; et Joule Work, une interface orientée objectif accessible sur ordinateur, mobile et commandes vocales. Pour accélérer l'adoption, SAP annonce un fonds de 100 millions d'euros et une série de partenariats avec Anthropic, Amazon Web Services, Google Cloud, Microsoft, NVIDIA, Mistral AI et Cohere. Un cas concret a été mis en avant avec l'énergéticien RWE : des agents IA analysent des milliers d'incidents passés sur des éoliennes offshore pour identifier l'origine probable d'une panne et générer automatiquement des ordres de maintenance préremplis. L'enjeu central de cette annonce est de faire passer l'IA d'un rôle d'assistant à celui d'exécutant autonome au coeur des opérations d'entreprise. L'assistant dédié à la clôture financière illustre l'ambition : en automatisant les écritures comptables, les rapprochements et la correction d'erreurs, SAP promet de réduire un processus qui prenait plusieurs semaines à quelques jours seulement. Pour les grandes entreprises soumises à des exigences croissantes de productivité, de conformité réglementaire et de rapidité, c'est une promesse directement chiffrée en gains opérationnels. Le lancement de sept solutions Industry AI, avec des règles métiers et réglementaires propres à chaque secteur, signale que SAP ne vise plus seulement les directions IT mais les métiers eux-mêmes, qu'il s'agisse de l'énergie, de la logistique ou de la fabrication. Cette offensive s'inscrit dans une compétition frontale entre les grands éditeurs ERP pour la domination de l'IA d'entreprise, face à Oracle, Microsoft et Salesforce qui poursuivent des ambitions similaires. SAP capitalise sur sa position de référence dans les grandes organisations mondiales, où ses systèmes gèrent déjà les données les plus critiques : c'est précisément ce capital de confiance et de données que le groupe cherche à monétiser via l'IA autonome. Le SAP Knowledge Graph, couche qui structure les relations entre données, processus et entités métiers, est présenté comme le socle différenciateur qui donnera aux agents une compréhension contextuelle que des solutions génériques ne peuvent pas offrir. Les partenariats avec des fournisseurs de modèles souverains comme Mistral AI et Cohere indiquent également que SAP anticipe des exigences de conformité et de localisation des données, particulièrement fortes en Europe. La prochaine étape sera de valider ces promesses à grande échelle dans des déploiements réels, au-delà des cas pilotes présentés en conférence.

UESAP, leader européen des ERP, intègre Mistral AI dans sa plateforme et anticipe explicitement les exigences européennes de souveraineté et de localisation des données, avec un fonds de 100 millions d'euros ciblant l'adoption dans les grandes organisations, dont de nombreuses entreprises françaises et européennes déjà clientes.

💬 Les 50 assistants et les 200 agents, c'est du bruit. Ce qui compte, c'est le Knowledge Graph, cette couche qui structure 30 ans de données métiers dans des millions d'entreprises, et que personne d'autre ne peut reproduire du jour au lendemain. Le cas RWE sur les éoliennes, bon, c'est encore un pilote, mais c'est exactement là où SAP peut devenir difficile à contourner.

OutilsOutil
1 source
Claude sur AWS : toute la plateforme d'Anthropic
78Le Big Data 

Claude sur AWS : toute la plateforme d'Anthropic

Anthropic a annoncé ce 11 mai 2026 que l'intégralité de sa plateforme Claude est désormais accessible directement depuis Amazon Web Services, sous forme de disponibilité générale. Concrètement, les clients AWS peuvent désormais utiliser l'ensemble des fonctionnalités de l'API Claude, Claude Managed Agents pour déployer des agents IA à grande échelle, exécution de code Python via API, recherche web intégrée, et un système de Skills permettant à Claude d'apprendre des comportements ou méthodes de travail spécifiques, sans quitter leur environnement cloud habituel. L'intégration couvre l'authentification IAM, la facturation unifiée AWS, les audits via CloudTrail, et un accès immédiat aux nouvelles fonctionnalités au fil de leur sortie. Jusqu'ici, plusieurs capacités avancées de Claude restaient réservées à l'API native d'Anthropic. Pour les équipes techniques en entreprise, le gain est avant tout opérationnel : plus besoin de gérer des systèmes parallèles de connexion, de facturation ou de permissions. Cette simplification réduit la friction à l'adoption et abaisse la barrière d'entrée pour les organisations déjà investies dans AWS. Anthropic précise toutefois que le traitement des données sur cette plateforme s'effectue en dehors de l'infrastructure AWS classique, une nuance importante pour les entreprises soumises à des contraintes strictes de souveraineté ou de conformité. Pour celles-là, Anthropic maintient une offre distincte via Amazon Bedrock, où AWS reste l'opérateur principal et les données demeurent dans l'infrastructure Amazon, deux positionnements qui ciblent deux profils d'entreprises différents. Cette annonce s'inscrit dans une bataille industrielle plus large où les plateformes cloud sont devenues les principales portes d'entrée de l'IA générative. OpenAI pousse ChatGPT Enterprise, Google multiplie les intégrations Gemini dans son écosystème, Microsoft verrouille ses capacités IA dans Azure, et Anthropic devait muscler son jeu pour ne pas rester un fournisseur de modèles sans ancrage infrastructure. Le partenariat entre Anthropic et Amazon, qui s'est matérialisé par un investissement massif d'Amazon dans Anthropic ces dernières années, trouve ici une nouvelle expression concrète. En intégrant Claude profondément dans AWS, Anthropic gagne en distribution et en crédibilité enterprise, tandis qu'Amazon renforce l'attractivité de son cloud pour les projets IA. La prochaine étape sera de voir si cette intégration accélère effectivement l'adoption de Claude dans les grandes organisations, ou si la question non résolue de la localisation des données freinera les déploiements dans les secteurs les plus régulés.

UELes entreprises européennes sur AWS peuvent désormais accéder à l'ensemble de la plateforme Claude sans friction opérationnelle, mais le traitement des données hors infrastructure AWS standard soulève des questions de conformité pour les secteurs soumis aux exigences de souveraineté numérique de l'UE.

OutilsOpinion
1 source
☕️ Bruxelles obtient un accès à GPT-5.5-Cyber, mais ça bloque toujours avec Mythos
79Next INpact 

☕️ Bruxelles obtient un accès à GPT-5.5-Cyber, mais ça bloque toujours avec Mythos

La Commission européenne a officiellement obtenu un accès à GPT-5.5-Cyber, le modèle de langage d'OpenAI dédié à la cybersécurité, disponible depuis le 7 mai 2026 en accès limité pour les organisations chargées de sécuriser les infrastructures critiques. Thomas Regnier, porte-parole de la Commission pour la souveraineté technologique, a salué « la transparence d'OpenAI et sa volonté de donner à la Commission un accès à son nouveau modèle », précisant que cela permettrait de « suivre de très près le déploiement » du modèle et de traiter certaines préoccupations de sécurité. C'est OpenAI qui a fait le premier pas en contactant directement Bruxelles. La Commission doit maintenant définir quelles entités internes pourront travailler concrètement avec le modèle : parmi les candidates figurent la DG Connect, l'AI Office et l'agence de cybersécurité ENISA. Côté Anthropic, les discussions pour un accès à Mythos, le modèle le plus ambitieux de la société, se poursuivent après quatre ou cinq réunions, mais restent loin du niveau atteint avec OpenAI. Cet accès revêt une importance stratégique pour l'Union européenne, qui cherche à ne pas rester à l'écart des outils d'IA les plus avancés dans un domaine aussi sensible que la cybersécurité. George Osborne, responsable d'OpenAI for Countries, a insisté sur le fait que les capacités de GPT-5.5-Cyber devaient être « accessibles aux nombreux défenseurs européens, et pas seulement à quelques-uns ». La Commission obtient ainsi un levier d'analyse directe sur un modèle dont les usages touchent aux infrastructures critiques du continent, ce qui lui permettra de mieux évaluer les risques et les conformités réglementaires avant tout déploiement élargi. L'absence d'accès équivalent à Mythos, en revanche, crée un angle mort notable : Bruxelles se retrouve en position d'observateur partiel face à l'offre d'Anthropic, dont le modèle est présenté comme particulièrement puissant. Ce mouvement s'inscrit dans la stratégie globale d'OpenAI baptisée « OpenAI for Countries », lancée pour tisser des partenariats institutionnels avec les gouvernements à l'échelle mondiale, et dont un plan d'action spécifique pour la cybersécurité en Europe a déjà été annoncé. Le programme TAC (Trusted Access for Cyber) d'OpenAI, élargi en avril avec GPT-5.4-Cyber, conditionne l'accès à une vérification préalable des partenaires, ce qui place la Commission dans un cercle restreint de confiance. Cette dynamique révèle une compétition croissante entre les grands laboratoires américains pour gagner la confiance des institutions européennes, à l'heure où l'AI Act impose de nouvelles obligations de transparence. Si Anthropic ne parvient pas à trouver un terrain d'accord similaire avec Bruxelles, Mythos risque de faire face à un accueil réglementaire plus difficile sur le marché européen que son rival d'OpenAI.

UELa Commission européenne dispose d'un accès direct à GPT-5.5-Cyber pour évaluer les risques sur les infrastructures critiques et vérifier la conformité à l'AI Act, tandis que l'absence d'accord similaire avec Anthropic pour Mythos crée un angle mort réglementaire potentiellement défavorable à ce modèle sur le marché européen.

💬 Ce qui se joue là, c'est pas de la conformité réglementaire, c'est de la conquête de territoire. OpenAI a fait le premier pas vers Bruxelles, a décroché l'accès, et se retrouve dans le cercle de confiance de la Commission avant que l'AI Act soit pleinement appliqué. Anthropic, après cinq réunions sans avancée sur Mythos, part avec un désavantage qui risque de coûter cher.

RégulationReglementation
1 source
Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français
80Le Big Data 

Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français

Selon un sondage Ifop publié en 2025, 43 % des actifs français déclarent utiliser des outils d'intelligence artificielle générative dans leur travail, et 29 % d'entre eux estiment que leur productivité a progressé de plus de 40 % grâce à ces solutions. Si ChatGPT domine encore largement avec 72 % des utilisateurs, l'écosystème s'est considérablement diversifié : Gemini de Google rassemble 20 % des utilisateurs professionnels, suivi de Microsoft Copilot (12 %), Mistral AI (6 %) et l'outil chinois DeepSeek. Au-delà des assistants conversationnels généralistes, d'autres catégories d'outils s'imposent dans les bureaux français : Notion AI pour la structuration de l'information et la documentation automatisée, Motion et Clockwise pour la planification intelligente des tâches et des agendas, ou encore Power BI et Microsoft Copilot pour transformer des données brutes en tableaux de bord interactifs accessibles en langage naturel. Ces chiffres révèlent une transformation profonde des pratiques professionnelles en France. L'IA n'est plus un outil expérimental réservé aux équipes tech : elle s'intègre dans les flux de travail quotidiens des secteurs aussi variés que la finance, la logistique, le marketing ou les administrations publiques. Microsoft Copilot, directement intégré à Word, Excel et Outlook, s'est imposé dans les grandes entreprises précisément parce qu'il ne demande aucun changement d'outil. Google Gemini progresse dans les organisations déjà équipées de Workspace. Pour les non-experts en données, la capacité à interroger un tableau Excel en français courant représente un gain d'autonomie réel, qui redistribue les compétences analytiques au sein des équipes. Cette montée en puissance de l'IA dans les bureaux français s'inscrit dans un contexte de double tension : entre efficacité et souveraineté des données. Face aux géants américains, plusieurs organisations françaises se tournent vers Mistral AI, principale alternative européenne, dont les modèles sont entraînés et hébergés en Europe, un argument décisif pour les acteurs soumis au RGPD ou à des contraintes de sécurité renforcées. Hugging Face, plateforme open-source fondée à Paris et désormais valorisée à plusieurs milliards de dollars, attire les entreprises qui veulent contrôler leurs pipelines d'IA sans dépendre d'une API propriétaire. L'adoption reste néanmoins inégale selon les secteurs : si les startups et les équipes marketing expérimentent rapidement, les industries plus régulées avancent avec prudence. La prochaine étape sera probablement moins le choix de l'outil que la capacité des organisations à former leurs salariés et à intégrer ces solutions dans des processus métiers cohérents.

UEL'adoption de l'IA dans 43 % des actifs français interroge directement la souveraineté des données face aux géants américains, et renforce le positionnement de Mistral AI et Hugging Face comme alternatives européennes conformes au RGPD.

💬 29 % qui déclarent +40 % de productivité, si c'est vrai, on parle d'un choc comparable à l'arrivée d'Excel dans les bureaux. Ce qui m'intéresse dans ces chiffres, c'est pas le classement des outils, c'est que Copilot tient son rang sans rien demander à personne, juste en restant dans Word et Outlook. La vraie question maintenant, c'est pas quel outil choisir, c'est qui va former les gens à s'en servir vraiment.

SociétéOutil
1 source
DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise
81Le Big Data 

DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise

DeepSeek, le laboratoire d'intelligence artificielle chinois fondé par Liang Wenfeng, serait en négociation pour boucler sa première levée de fonds externe, d'un montant compris entre 3 et 4 milliards de dollars, à une valorisation pouvant atteindre 50 milliards de dollars. L'information, révélée en premier par le Financial Times puis confirmée par le Wall Street Journal, place DeepSeek parmi les startups d'IA les plus valorisées au monde. Le fonds national chinois dédié à l'intelligence artificielle, doté de 60 milliards de yuans, serait en discussions pour mener l'opération, avec Tencent également présent dans les négociations. Jusqu'à présent, DeepSeek fonctionnait de façon quasi autonome, financée principalement par High-Flyer, le hedge fund de son fondateur, qui conserve environ 89,5 % du capital via ses participations personnelles et affiliées. Cette levée de fonds marque un tournant stratégique pour DeepSeek. Les capitaux recherchés visent à renforcer les infrastructures de calcul de la société et à améliorer les conditions offertes à ses ingénieurs, dans un contexte de compétition féroce pour attirer les talents. Le développement des agents IA, qui exécutent des tâches complexes avec une intervention humaine réduite, exige désormais une puissance de calcul nettement supérieure à celle des chatbots classiques, ce qui se traduit par des coûts en GPU, datacenters et recrutement considérablement plus élevés. Pour rester dans la course face à ByteDance, Alibaba, MiniMax ou Moonshot AI, DeepSeek ne peut plus se permettre de fonctionner en dehors des circuits d'investissement institutionnels. Le succès viral des modèles V3 et R1 de DeepSeek début 2025 avait provoqué un choc sur les marchés technologiques mondiaux, en démontrant qu'il était possible d'atteindre des performances comparables à celles d'OpenAI ou d'Anthropic à une fraction du coût, grâce à une approche open source radicale. Pékin avait alors perçu dans la startup un potentiel champion national capable de rivaliser avec les géants américains dans la course à l'IA générale. L'intérêt du fonds souverain pour cette opération confirme que l'État chinois entend désormais consolider son soutien aux laboratoires les plus prometteurs, réduisant ainsi sa dépendance technologique vis-à-vis des États-Unis dans un domaine jugé stratégique. DeepSeek doit cependant confirmer cette trajectoire sur le plan technique : son nouveau modèle V4, présenté comme redéfinissant l'état de l'art open source pour les agents IA, fait l'objet d'évaluations indépendantes mitigées, certains analystes estimant qu'il reste en retrait face aux meilleurs modèles concurrents.

UELa montée en puissance de DeepSeek, soutenue par des fonds souverains chinois, intensifie la compétition mondiale en IA et fragilise la position des acteurs européens face à deux blocs (US/Chine) disposant désormais de ressources d'investissement massives.

💬 Ce qui m'intéresse, c'est pas la valorisation à 50 milliards. C'est que DeepSeek, le labo qui nous avait sorti V3 et R1 en mode "regardez ce qu'on fait avec trois fois rien", doit maintenant aller chercher de l'argent à l'État pour rester dans la course. Le modèle "on fait mieux moins cher" a ses limites dès qu'on passe aux agents IA, et V4 fait pas l'unanimité non plus, donc on est un peu à 50 milliards sur une promesse pas encore tenue.

BusinessActu
1 source
Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare
82Next INpact 

Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare

Des utilisateurs de Google Chrome ont découvert sur leurs machines un fichier baptisé weights.bin, pesant jusqu'à 4 gigaoctets, téléchargé sans la moindre notification ni demande de consentement. Ce fichier est stocké dans un dossier nommé OptGuideOnDeviceModel, accessible sous Windows dans AppData\Local\Google\Chrome\User Data\Default\ et sous macOS dans ~/Library/Application Support/Google/Chrome/Default/. Les premiers signalements remontent à mi-2025, mais le sujet a resurgi le 4 mai 2026 avec la publication d'une analyse détaillée par Alexander Hanff, consultant en sécurité connu sous le pseudonyme ThatPrivacyGuy. Selon ses observations, Chrome télécharge ce fichier dans les quinze minutes suivant l'ouverture du navigateur, et le recrée automatiquement à chaque lancement s'il a été supprimé manuellement. Le phénomène n'est pas universel : les auteurs de l'article source n'ont trouvé aucune trace du fichier sur quatre machines testées sous Windows et macOS. L'absence totale d'information de la part de Google constitue le cœur du problème. Occuper 4 gigaoctets sur le disque d'un utilisateur sans explication ni possibilité simple de refus représente une atteinte directe à la maîtrise que chacun devrait avoir sur son propre matériel. Alexander Hanff va plus loin : il estime que ce comportement contrevient à la directive européenne e-Privacy de 2002, qui encadre précisément les accès aux ressources des terminaux des utilisateurs. Il réclame de Google une communication claire sur la nature du fichier, l'adoption d'un mécanisme d'opt-in exigeant un consentement préalable, et la possibilité de supprimer définitivement ce contenu. L'impact n'est pas seulement individuel : le consultant tente également d'évaluer l'empreinte environnementale de ces téléchargements répétés sur des centaines de millions d'appareils, même si ce calcul reste hautement spéculatif. Ce fichier n'est pourtant pas totalement opaque sur le plan technique. Il correspond à l'intégration de Gemini Nano, le modèle d'intelligence artificielle embarqué de Google, directement dans Chrome, une démarche documentée publiquement depuis fin 2024. Ces poids de modèle servent à alimenter des fonctionnalités comme la détection automatique de langue ou d'autres outils d'IA locale dans le navigateur. Google n'a pas encore réagi publiquement à la controverse. L'affaire s'inscrit dans un contexte plus large de déploiement silencieux de fonctions d'IA par les grands éditeurs : Alexander Hanff avait récemment épinglé Claude Desktop d'Anthropic pour un comportement similaire, pré-autorisant ses extensions de navigateur sans en informer l'utilisateur. La pression réglementaire européenne et la sensibilité croissante du public sur la souveraineté numérique rendent ce type de pratique de plus en plus difficile à maintenir sans déclencher de réaction.

UELe comportement de Chrome pourrait enfreindre la directive e-Privacy européenne de 2002, exposant Google à des recours réglementaires pour dépôt de fichiers sur les terminaux d'utilisateurs européens sans consentement préalable.

💬 4 Go sans demander, n'importe quelle startup se ferait retourner pour ça. Le fichier en lui-même n'est pas mystérieux, c'est Gemini Nano, documenté depuis fin 2024, mais déposer ça silencieusement sur des centaines de millions de machines sans opt-in, ça ne tient pas face à l'e-Privacy. Reste à voir ce que ça va coûter à Google au niveau réglementaire.

ÉthiqueReglementation
1 source
Ruben BRYON, construire une alternative européenne au cloud américain
83FrenchWeb 

Ruben BRYON, construire une alternative européenne au cloud américain

Ruben Bryon a commencé à coder seul à l'âge de 12 ans, allant jusqu'à percer un mur dans le garage familial pour refroidir ses premiers serveurs. Quinze ans plus tard, il dirige Verda, une entreprise fondée sous le nom de DataCrunch, qui ambitionne de construire la première "Gigafactory" européenne de l'intelligence artificielle. Concrètement, il s'agit de déployer des centres de données massivement équipés en GPU, les puces indispensables à l'entraînement et à l'inférence des grands modèles d'IA, sur le sol européen, en dehors de la dépendance aux hyperscalers américains comme AWS, Azure ou Google Cloud. L'enjeu est considérable pour l'industrie technologique européenne. Les startups et laboratoires de recherche du continent paient aujourd'hui leurs coûts de calcul à des entreprises américaines, ce qui crée une dépendance structurelle tant sur le plan économique que réglementaire. Une infrastructure GPU souveraine permettrait aux acteurs européens de développer et déployer des modèles d'IA sans que leurs données transitent par des juridictions soumises au droit américain, un point particulièrement sensible depuis le Cloud Act de 2018. L'initiative de Bryon s'inscrit dans un mouvement plus large de souveraineté numérique européenne, porté aussi bien par des régulations comme le RGPD que par des initiatives industrielles telles que GAIA-X. Face à la concentration du marché du cloud d'IA entre les mains de quelques géants américains, des acteurs comme Verda cherchent à occuper le créneau de l'infrastructure de confiance en Europe, à mesure que la demande en puissance de calcul pour l'IA continue d'exploser.

UEVerda déploie des centres de données GPU sur sol européen pour permettre aux startups et laboratoires de recherche européens d'entraîner leurs modèles d'IA sans transiter par des juridictions soumises au Cloud Act américain.

💬 C'est exactement ce qu'on attendait depuis que le Cloud Act a rendu la question brûlante. Partir de l'infra GPU, pas du cadre réglementaire, c'est ce qui distingue Verda de toutes les initiatives européennes de souveraineté numérique qui finissent en comité de pilotage. Reste à voir si les capitaux suivent à l'échelle d'une gigafactory.

InfrastructureOpinion
1 source
Cette guerre ne finit jamais : la Maison-Blanche freine l’expansion d’une IA d’Anthropic jugée incontrôlable
84Le Big Data 

Cette guerre ne finit jamais : la Maison-Blanche freine l’expansion d’une IA d’Anthropic jugée incontrôlable

La Maison-Blanche a bloqué le projet d'Anthropic d'élargir l'accès à son modèle d'IA Mythos, actuellement limité à environ cinquante organisations. L'entreprise souhaitait intégrer soixante-dix nouveaux clients pour atteindre environ cent vingt organisations partenaires, mais Washington a mis son veto. Officiellement, la décision repose sur des impératifs de sécurité nationale. En réalité, selon plusieurs sources internes citées dans des analyses récentes, le gouvernement américain craint surtout de perdre son accès prioritaire à la puissance de calcul associée au modèle : davantage de clients signifie moins de ressources disponibles pour les usages gouvernementaux. Un tweet analysant la situation résume la logique de la Maison-Blanche : ce n'est pas tant la dangerosité du modèle qui pose problème que la volonté de garder la main dessus. L'enjeu dépasse la simple question d'accès. Mythos est décrit comme capable d'identifier et d'exploiter des failles critiques dans des infrastructures sensibles, réseaux électriques, hôpitaux, centrales énergétiques, avec une efficacité sans précédent. Des analyses internes évoquent un niveau de performance offensif jugé inédit pour un système commercial. Ce risque a été aggravé par un incident récent : des acteurs malveillants auraient réussi à accéder au modèle et exploiteraient déjà ses capacités offensives, au-delà du simple test. Ce point change radicalement la nature du débat : il ne s'agit plus d'un risque théorique mais d'une menace active, ce qui justifie aux yeux de Washington un contrôle strict du périmètre d'accès. Anthropic elle-même aurait alerté en interne sur ces dangers. Les tensions entre la Maison-Blanche et Anthropic ne sont pas nouvelles. Plus tôt en 2026, le Pentagone avait rompu un contrat avec l'entreprise après qu'elle a refusé de fournir un accès sans restriction à ses outils, arguant de la nécessité d'encadrer les usages sensibles. Ce refus avait durci le climat entre les deux parties. Depuis, Washington voit dans Anthropic un acteur difficile à contrôler, tandis que l'entreprise défend une approche responsable face à des demandes qu'elle juge incompatibles avec ses principes de sécurité. Le bras de fer autour de Mythos illustre une tension plus large : à mesure que les modèles frontières deviennent des ressources stratégiques, les gouvernements cherchent à les traiter comme des actifs souverains, en concurrence directe avec la logique commerciale de leurs développeurs. La question de qui contrôle l'accès à ces systèmes, et à quelles conditions, est désormais au coeur des rivalités entre l'industrie privée de l'IA et les appareils d'État.

UECe bras de fer entre Anthropic et Washington sur le contrôle d'un modèle IA aux capacités offensives inédites pose un précédent qui pourrait influencer les débats européens sur la régulation des systèmes IA à double usage dans le cadre de l'AI Act.

SécuritéOpinion
1 source
Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU
85Next INpact 

Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU

La Chine vient de révéler, sans aucune communication officielle, l'existence d'un supercalculateur exascale baptisé LineShine, hébergé au Centre National de Supercalcul de Shenzhen (NSCC-SZ). La machine atteint une puissance théorique de 2,47 ExaFLOPS, dont 1,2 ExaFLOPS ont été effectivement mesurés lors de son utilisation pour entraîner un modèle de type MLIP (Machine Learning Interatomic Potentials), soit à peine un quart de sa capacité maximale. LineShine embarque 12,4 millions de cœurs de calcul et 1 310 téraoctets de mémoire HBM. Ce qui frappe immédiatement les observateurs : cette architecture est entièrement scalaire, sans aucun GPU. L'information n'est pas venue d'un communiqué de presse mais d'une publication scientifique parue il y a deux semaines, repérée et relayée par Stéphane Requena, directeur technique du Genci (Grand Équipement National de Calcul Intensif), sur LinkedIn. Si LineShine était soumis au classement Top500, référence mondiale des supercalculateurs, il se retrouverait au coude à coude avec El Capitan, le numéro un mondial actuellement en service aux États-Unis. L'enjeu dépasse la performance brute : ce supercalculateur démontre que la Chine est capable de construire des infrastructures de calcul de premier rang mondial sans dépendre des GPU haute performance de NVIDIA, dont l'exportation vers la Chine est soumise à embargo américain. L'absence de GPU dans une machine de cette envergure représente un choix architectural délibéré et une réponse technologique directe aux restrictions imposées par Washington. Pour les acteurs de l'IA et de la simulation scientifique, c'est la preuve que les restrictions d'exportation n'ont pas bloqué la montée en puissance chinoise, mais l'ont orientée vers des solutions souveraines. La Chine ne participe plus au Top500 depuis plusieurs années, dans un contexte de tensions croissantes avec les États-Unis autour des technologies stratégiques. Depuis les premières vagues de sanctions, Pékin a systématiquement développé ses propres alternatives matérielles et logicielles, tout en maintenant le silence sur ses capacités réelles. LineShine s'inscrit dans cette logique d'autonomie technologique assumée : les avancées chinoises en supercalcul se découvrent désormais à travers des publications académiques, non par des annonces officielles. Les prochains mois pourraient révéler d'autres systèmes de cette génération, alors que la course au calcul exascale s'accélère aussi bien pour la simulation climatique, la recherche pharmaceutique que pour l'entraînement de modèles d'intelligence artificielle de grande taille.

UELa découverte a été relayée par Stéphane Requena, directeur technique du GENCI (institution française de calcul intensif), signalant que les sanctions américaines n'ont pas freiné la montée en puissance chinoise, un avertissement stratégique pour la souveraineté technologique européenne en matière d'infrastructure HPC.

💬 2,47 ExaFLOPS sans un seul GPU, et on l'apprend par une publication académique, pas un communiqué de presse. L'embargo américain n'a pas freiné la Chine, il l'a juste orientée vers ses propres solutions, et visiblement ça tient la route. Ce qui devrait vraiment inquiéter l'Europe, c'est qu'on ne sait pas combien d'autres machines comme ça existent déjà.

InfrastructureOpinion
1 source
Analyse de marchés publics : découvrez l’outil Odiana
86Le Big Data 

Analyse de marchés publics : découvrez l’outil Odiana

Le cabinet lyonnais Odialis a lancé Odiana, une plateforme d'intelligence artificielle destinée aux TPE et PME qui souhaitent accéder aux marchés publics sans se noyer dans la complexité administrative. Conçu pour scanner automatiquement les appels d'offres, l'outil extrait en quelques secondes les points de vigilance, les obligations contractuelles et les critères d'éligibilité de chaque dossier. Accessible dès 49 euros par mois, il s'appuie sur seize années d'expérience terrain accumulées par Odialis dans le conseil aux entreprises pour la commande publique. L'outil intègre également un accompagnement à la décision stratégique dite "Go / No Go", qui aide les dirigeants à arbitrer rapidement s'il vaut la peine de répondre à un appel d'offres, et guide ensuite la rédaction du mémoire technique pour maximiser les chances de succès. Pour les petites structures, l'accès aux contrats publics représente un obstacle réel : les dossiers sont volumineux, le vocabulaire juridique opaque, et le temps à y consacrer souvent disproportionné par rapport aux ressources disponibles. Odiana vise à combler ce fossé en automatisant la veille et la phase d'analyse préliminaire, deux tâches chronophages qui découragent de nombreux dirigeants. En réduisant le coût d'entrée technique, la plateforme pourrait permettre à des entreprises qui s'excluaient jusqu'ici du marché public de candidater de manière compétitive, élargissant de facto la concurrence dans un secteur dominé par les grands groupes. Sur le plan technique, Odiana a été conçue avec une architecture entièrement française, hébergée localement et conforme au RGPD, s'appuyant sur les modèles de langage de Mistral AI pour s'affranchir des juridictions étrangères, notamment américaines. Ce choix de souveraineté numérique répond à une demande croissante des acteurs économiques français soucieux de la confidentialité de leurs données stratégiques. Le projet a bénéficié du soutien de Bpifrance et de partenaires industriels comme La Poste. Odiana s'inscrit dans une tendance plus large d'outillage IA à destination des PME françaises, un segment que plusieurs acteurs cherchent à capter en combinant LLM souverains et expertise sectorielle verticale, plutôt qu'en proposant des outils généralistes.

UEOutil 100 % français (hébergement local, RGPD, modèles Mistral AI) soutenu par Bpifrance et La Poste, qui facilite l'accès des TPE/PME françaises aux marchés publics tout en renforçant la souveraineté numérique sur les données stratégiques d'entreprise.

OutilsOutil
1 source
FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois
87Le Big Data 

FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois

L'équipe Qwen d'Alibaba a présenté le 29 avril 2026 FlashQLA, une bibliothèque de noyaux d'attention linéaire haute performance construite sur TileLang, un langage de programmation optimisé pour le calcul parallèle. Les chiffres avancés sont nets : la propagation avant des modèles est accélérée de 2 à 3 fois, tandis que la rétropropagation, phase critique de l'entraînement, voit sa vitesse pratiquement doubler. L'architecture repose sur une division des calculs en deux noyaux distincts plutôt qu'un bloc unifié, ce qui se traduit par une légère surcharge mémoire mais des performances réelles supérieures sur machines modestes. La rétropropagation bénéficie en particulier d'un pipeline en 16 étapes optimisé au niveau du warp avec des contraintes mémoire très faibles. Ce qui distingue FlashQLA des solutions concurrentes est sa cible explicite : les appareils personnels et l'edge computing, pas les data centers. Alibaba positionne cet outil pour faire tourner des modèles d'IA agentielle directement sur des ordinateurs portables et machines locales, réduisant la dépendance aux serveurs cloud. Les gains sont particulièrement marqués pour les petits modèles et les tâches à contexte long, deux cas d'usage centraux pour l'IA embarquée. Pour les développeurs et les entreprises qui déploient des agents IA en production, cela signifie des coûts d'inférence réduits, des latences plus faibles et une meilleure utilisation de la mémoire sans changement de matériel. FlashQLA s'inscrit dans une tendance de fond qui traverse l'ensemble de l'industrie depuis 2024 : la course à l'efficacité des modèles en dehors du cloud. Face à des coûts d'inférence toujours élevés et à des préoccupations croissantes autour de la souveraineté des données, les grandes entreprises technologiques cherchent à rapprocher la puissance de calcul de l'utilisateur final. Alibaba, via son équipe Qwen déjà connue pour ses modèles ouverts compétitifs face à GPT-4, renforce ici sa position dans l'écosystème open source en proposant une brique d'optimisation bas niveau directement utilisable par la communauté. La publication fait suite à plusieurs annonces similaires dans l'industrie, dont FlashAttention de Tri Dao ou les optimisations kernel de Meta pour Llama. Si FlashQLA tient ses promesses à l'échelle, il pourrait accélérer la migration d'une partie des charges d'inférence vers le local, rééquilibrant durablement le rapport entre cloud centralisé et calcul distribué.

UEL'axe edge computing et réduction de dépendance au cloud s'aligne indirectement avec les objectifs de souveraineté numérique européenne, mais aucun impact direct sur la France ou l'UE n'est identifiable.

InfrastructureOpinion
1 source
Les risques cachés dans le financement de l'IA
88The Information AI 

Les risques cachés dans le financement de l'IA

Lors d'une conférence intitulée "Financing the AI Revolution" organisée lundi, des investisseurs et banquiers spécialisés dans l'IA ont été interrogés sur les risques cachés du marché actuel. Après un silence gêné, Martin Fichtner, responsable des investissements technologiques pour le fonds souverain singapourien Temasek, basé à San Francisco, a évoqué la "dérivée seconde" de la demande : non pas un ralentissement de la croissance, mais un simple fléchissement de son accélération suffirait à inquiéter les marchés. Son confrère Jim Prusko, gestionnaire de portefeuille senior chez Magnetar, a de son côté cité le risque réglementaire et les pressions politiques croissantes contre les centres de données américains comme menaces concrètes au déploiement de l'infrastructure IA. Magnetar est l'un des principaux soutiens financiers de CoreWeave, développeur de data centers, dont le vice-président au développement Nick Robbins reconnaît lui-même une tension permanente entre l'offre et la demande, notant que l'entreprise "ne peut pas lever des capitaux assez vite pour suivre la demande." Ces risques ne sont pas théoriques : deux scénarios se déroulent déjà sous les yeux des investisseurs. Anthropic a récemment relevé ses tarifs à un niveau tel que les coûts pour certains clients pourraient doubler, voire tripler selon certaines estimations. Dans un contexte où de nombreuses entreprises n'ont pas encore mesuré de gains concrets liés à l'IA, cette hausse fragilise leur appétit pour des dépenses importantes. Parallèlement, The Information rapporte chez OpenAI des objectifs manqués, une instabilité au niveau de la direction et une croissance décevante, une série de révélations qui a suffi à faire chuter les cours en bourse d'Oracle et de CoreWeave, deux acteurs ayant parié massivement sur la croissance de l'entreprise. L'enthousiasme reste néanmoins dominant : des dizaines de milliards de dollars ont afflué vers des acteurs comme Anthropic et OpenAI, portés par l'amélioration spectaculaire des modèles et une demande commerciale en forte hausse. Des introductions en bourse sont attendues pour ces deux sociétés ainsi que pour SpaceX. Mais l'histoire des booms technologiques enseigne que les investisseurs ont tendance à anticiper la réalité. Le vrai risque n'est pas l'éclatement d'une bulle, mais les déséquilibres ponctuels inhérents à toute ruée vers une technologie de rupture : lorsque l'offre finira par dépasser la demande chez certains opérateurs très endettés comme CoreWeave et ses concurrents, la correction pourrait être sévère pour les entreprises concernées et leurs créanciers. Les signaux d'alerte existent, même si peu d'investisseurs sont prêts à les nommer publiquement.

UELes hausses de tarifs d'Anthropic et les risques de correction du marché de l'infrastructure IA pourraient renchérir le coût des solutions IA pour les entreprises européennes et freiner leur adoption.

BusinessOpinion
1 source
Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents
89VentureBeat AI 

Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents

La startup américaine Poolside, fondée à San Francisco en 2023, a lancé ce 28 avril 2026 deux nouveaux modèles de langage sous la marque Laguna, conçus spécifiquement pour les tâches de codage agentique. Le premier, Laguna M.1, est un modèle propriétaire de 225 milliards de paramètres au format Mixture of Experts (MoE), avec 23 milliards de paramètres actifs, destiné aux environnements d'entreprise et gouvernementaux à hautes exigences de sécurité. Le second, Laguna XS.2, est un modèle open source sous licence Apache 2.0 de 33 milliards de paramètres (3 milliards actifs), téléchargeable et exécutable localement sur un simple GPU de bureau ou d'ordinateur portable, sans connexion internet. Poolside accompagne ces deux modèles d'un agent de codage en ligne de commande baptisé "pool" et d'un environnement de développement web mobile appelé "shimmer". Temporairement, même le plus grand modèle M.1 est accessible gratuitement via l'API Poolside et des partenaires comme OpenRouter, Ollama et Baseten. L'arrivée de Laguna XS.2 en open source représente un signal fort dans un secteur dominé soit par des modèles propriétaires coûteux comme Claude d'Anthropic ou GPT-5.5 d'OpenAI, soit par des modèles chinois à licence ouverte comme ceux de DeepSeek. Poolside offre ici une alternative américaine, exécutable entièrement hors ligne, ce qui répond à un besoin critique pour les agences gouvernementales et les entreprises opérant dans des environnements ultra-sécurisés. L'ingénieur post-entraînement George Grigorev a précisé que Poolside peut "livrer des poids dans des environnements totalement isolés on-premises, sans connexion réseau", un avantage décisif face aux solutions cloud d'Anthropic ou Google. Par ailleurs, les deux modèles Laguna ont été entraînés intégralement from scratch, contrairement à plusieurs laboratoires américains qui s'appuient sur les modèles de base Qwen d'Alibaba, ce qui leur confère une indépendance technique notable. Poolside s'est jusqu'ici concentrée sur des contrats gouvernementaux et de défense, construisant ses modèles dans un environnement interne appelé "Model Factory", dont le moteur central est un logiciel maison nommé Titan. L'entreprise utilise également un optimiseur d'entraînement appelé Muon, qui accélère l'apprentissage d'environ 15% par rapport aux méthodes standards, un avantage compétitif non négligeable en termes de coûts et de délais. En s'ouvrant maintenant à la communauté des développeurs et à la recherche publique, Poolside change de stratégie et entre de plein pied dans la bataille de l'open source agentique, à un moment où les entreprises tech cherchent à réduire leur dépendance aux API propriétaires pour des raisons de coût, de confidentialité et de souveraineté technologique.

UELes organisations européennes en environnement isolé (défense, administration) peuvent déployer localement un modèle de codage agentique open source américain sans dépendance cloud, renforçant leur autonomie technologique.

LLMsActu
1 source
La Chine bloque le rachat de Manus par Meta, sur fond de rivalité sino-américaine en IA
90Ars Technica AI 

La Chine bloque le rachat de Manus par Meta, sur fond de rivalité sino-américaine en IA

Le gouvernement chinois a officiellement ordonné à Meta de défaire son acquisition de la société d'intelligence artificielle Manus le 27 avril 2026, invoquant des raisons de sécurité nationale. Cette transaction, conclue en décembre 2025 pour un montant de 2 milliards de dollars, avait déjà été placée sous enquête dès janvier 2026, les autorités de Pékin ayant en parallèle interdit aux deux cofondateurs de Manus, des entrepreneurs technologiques chinois, de quitter le territoire national pendant la durée de l'investigation, selon le Wall Street Journal. La décision finale consacre l'interdiction totale des investissements étrangers dans Manus au nom de la sécurité nationale. Ce blocage illustre à quel point les transactions transfrontalières entre entreprises américaines et chinoises dans le domaine de l'IA sont devenues quasi impossibles à mener à terme. Des deux côtés du Pacifique, les autorités adoptent une ligne de plus en plus dure face aux opérations de fusion-acquisition impliquant des technologies sensibles. Pour Meta, il s'agit d'un revers stratégique majeur : l'entreprise perd l'accès à une technologie d'agents IA avancée et doit rembourser ou restructurer un investissement de deux milliards de dollars. Pour l'industrie, ce précédent envoie un signal clair sur les limites imposées aux partenariats sino-américains dans les secteurs jugés stratégiques. Manus avait fait son entrée remarquée en mars 2025 en se présentant comme un agent IA généraliste capable de réaliser des tâches complexes pour le compte des utilisateurs, comme rechercher un bien immobilier ou réserver des billets d'avion et des hôtels. Techniquement, le système fonctionne comme une surcouche agentique reposant sur le modèle Claude 3.7 Sonnet d'Anthropic, coordonnant plusieurs agents spécialisés, dont un agent planificateur et un agent exécuteur capable de naviguer sur des sites web, créer des tableurs et même développer des applications. Dans un contexte de rivalité technologique croissante entre Washington et Pékin, notamment sur les grands modèles de langage et les agents autonomes, cette affaire illustre comment l'IA est désormais traitée comme un enjeu de souveraineté nationale à part entière.

UELa rivalité sino-américaine en IA contraint les entreprises européennes à choisir leur camp et complique tout partenariat ou acquisition transfrontalière impliquant des acteurs des deux blocs.

💬 2 milliards pour récupérer rien du tout. Ce blocage était prévisible depuis que les deux blocs traitent l'IA comme de l'armement, mais ça fait quand même bizarre de voir Meta se faire éjecter par Pékin sur un agent qui tournait sous Claude. Les boîtes européennes feraient bien de prendre note avant de se retrouver coincées au milieu.

BusinessOpinion
1 source
Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?
91Le Big Data 

Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?

Le 24 avril 2026, Meta Platforms a officialisé un accord de plusieurs milliards de dollars avec Amazon Web Services portant sur l'accès à des dizaines de millions de cœurs de puces Graviton sur une durée estimée entre trois et cinq ans. Les puces concernées sont les Graviton5, gravées en 3 nanomètres, conçues en interne par Amazon via Annapurna Labs sur architecture Arm. Meta devient ainsi l'un des cinq plus grands clients de cette gamme de processeurs. Selon Nafea Bshara, vice-présidente d'AWS, le critère décisif pour Meta a été le rapport performance/prix, dans un contexte où les coûts d'infrastructure liés à l'IA atteignent des niveaux inédits. L'accord marque une rupture avec la logique purement GPU qui dominait les décisions d'infrastructure depuis deux ans et confirme un rééquilibrage profond des architectures de calcul à grande échelle. Ce retour des CPU au premier plan n'est pas un hasard. L'essor des agents IA, ces systèmes capables d'exécuter des tâches complexes de manière autonome, génère des besoins de calcul différents de ceux de l'entraînement des grands modèles. Les CPU jouent un rôle central dans les phases dites de post-entraînement, où les modèles sont ajustés pour des usages spécifiques, ainsi que dans la gestion de l'orchestration en amont et en aval des GPU. Loin de les remplacer, ils les complètent en optimisant l'ensemble de la chaîne de traitement. Pour Meta, qui déploie Meta AI à des centaines de millions d'utilisateurs et développe activement des expériences agentiques, la capacité à absorber des volumes massifs d'inférences à coût maîtrisé est devenue un avantage compétitif direct. Cet accord s'inscrit dans une stratégie d'infrastructure délibérément diversifiée. Meta multiplie les partenariats avec Nvidia, AMD et Arm Holdings, refusant toute dépendance à une architecture unique. La collaboration avec Amazon remonte à 2016, mais bascule ici vers un engagement sur une technologie CPU spécifique, ce qui est inédit dans leur relation. Sur le plan géographique, la majorité des déploiements sera réalisée aux États-Unis, dans un contexte de souveraineté technologique et de sécurisation des chaînes d'approvisionnement devenues des enjeux stratégiques. Du côté d'Amazon, valider Meta comme client de référence renforce la crédibilité des Graviton face aux solutions concurrentes et soutient une intégration verticale plus large : AWS vient d'annoncer 5 milliards de dollars supplémentaires investis dans Anthropic, qui utilisera elle aussi ces mêmes puces maison.

InfrastructureOpinion
1 source
Mercedes-Benz mise sur l’IA on-device avec Liquid AI pour ses futurs modèles
92Le Big Data 

Mercedes-Benz mise sur l’IA on-device avec Liquid AI pour ses futurs modèles

Mercedes-Benz a officialisé le 23 avril 2026 un partenariat pluriannuel avec Liquid AI, une startup spécialisée dans les modèles d'intelligence artificielle embarquée. L'accord prévoit le déploiement à grande échelle de l'IA on-device sur les véhicules équipés des systèmes MBUX de troisième et quatrième générations en Amérique du Nord, avec un premier déploiement en production attendu dès le second semestre 2026. Concrètement, Mercedes-Benz intégrera les modèles Liquid Foundations (LFM) directement dans le matériel du véhicule, ce qui permettra à l'assistant vocal MBUX de traiter localement la reconnaissance vocale, la compréhension du langage naturel et certaines capacités de raisonnement, sans passer par des serveurs distants. Cette IA embarquée ne remplacera pas les architectures cloud existantes, mais les complètera dans une logique hybride : le traitement local pour les usages quotidiens, le cloud pour les cas plus complexes. L'enjeu est double : rapidité et confidentialité. En éliminant la latence des échanges avec des serveurs distants, le système peut répondre en temps réel aux demandes du conducteur, y compris des requêtes complexes combinant navigation, confort et information. La relation entre le conducteur et son véhicule devient plus conversationnelle, moins dépendante de commandes rigides et préformatées. Pour l'industrie automobile, ce virage vers l'IA locale représente une rupture significative : les constructeurs ne sont plus contraints de s'appuyer entièrement sur des infrastructures cloud tierces, ce qui réduit les coûts d'exploitation et renforce la souveraineté sur les données des utilisateurs, un argument commercial de poids face aux régulations croissantes sur la vie privée. Ce partenariat s'inscrit dans la stratégie plus large du "software-defined vehicle", le véhicule défini par logiciel, que Mercedes-Benz construit autour de son système d'exploitation propriétaire MB.OS. Jörg Burzer, membre du directoire de Mercedes-Benz, présente cette approche comme "les bases d'une nouvelle génération d'expériences embarquées intuitives et multimodales". Pour Liquid AI, fondée par Ramin Hasani, le secteur automobile constitue l'un des débouchés les plus ambitieux de l'IA dans le monde physique : ses modèles sont conçus pour être légers et optimisés, capables de fonctionner sur le matériel déjà présent dans les véhicules sans nécessiter de composants supplémentaires coûteux. L'automobile devient ainsi un nouveau terrain de compétition pour les acteurs de l'IA embarquée, aux côtés d'Apple, Google et des équipementiers traditionnels, dans une course où la maîtrise du logiciel embarqué conditionne désormais la différenciation entre constructeurs.

UEMercedes-Benz, constructeur allemand emblématique, renforce la souveraineté des données de ses clients européens en traitant localement les interactions vocales, un argument de conformité direct face au RGPD.

RobotiqueOpinion
1 source
Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp
93FrenchWeb 

Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp

La Plateforme des données de santé a officiellement sélectionné Scaleway, filiale du groupe Iliad, pour héberger ses infrastructures, mettant fin à des années de dépendance vis-à-vis de Microsoft Azure. Ce choix, issu d'un appel d'offres rigoureux, éloigne les données médicales de millions de Français du spectre du Cloud Act américain et affirme un virage vers la souveraineté numérique. En parallèle, la startup UNIVITY annonce une levée de 27 millions d'euros pour déployer une infrastructure 5G spatiale combinant satellites et réseaux terrestres. Enfin, Devendra Chaplot, chercheur passé par Mistral AI, rejoint xAI, la société d'intelligence artificielle d'Elon Musk. Ces trois actualités convergent autour d'un même enjeu : la souveraineté technologique européenne. Le choix de Scaleway par le Health Data Hub répond aux alertes répétées de la CNIL sur les risques d'exposition des données de santé aux injonctions extraterritoriales américaines, et constitue un signal fort pour les opérateurs de cloud souverain français. L'investissement d'UNIVITY positionne l'Europe sur le marché de la connectivité satellitaire face à Starlink, tandis que le départ de Chaplot vers xAI illustre la capacité des mastodontes américains à capter les talents IA européens. La controverse autour du Health Data Hub remonte à 2020, quand le contrat Microsoft avait déclenché une vague de critiques de juristes et d'associations de défense des droits numériques. Scaleway, certifié hébergeur de données de santé (HDS), était depuis le candidat naturel à ce contrat stratégique. Plus largement, ces trois événements dessinent un écosystème européen en tension entre ambition souveraine et attraction irrésistible des géants américains de la tech.

UELe Health Data Hub migre de Microsoft Azure vers Scaleway (groupe Iliad), soustrayant les données médicales de millions de Français au Cloud Act américain, victoire directe pour la souveraineté numérique française et signal fort pour l'écosystème cloud souverain européen.

InfrastructureActu
1 source
NVIDIA et Google réduisent les coûts d'inférence en IA
94AI News 

NVIDIA et Google réduisent les coûts d'inférence en IA

Lors de la conférence Google Cloud Next, Google et NVIDIA ont dévoilé une nouvelle génération d'infrastructure destinée à réduire drastiquement le coût de l'inférence IA à grande échelle. Les deux entreprises ont présenté les instances A5X bare-metal, reposant sur les systèmes rack NVIDIA Vera Rubin NVL72. Cette architecture promet une réduction jusqu'à dix fois du coût d'inférence par token par rapport aux générations précédentes, tout en multipliant par dix le débit de tokens par mégawatt. Pour atteindre ces performances, les instances A5X combinent les SuperNICs NVIDIA ConnectX-9 avec la technologie réseau Google Virgo, permettant de connecter jusqu'à 80 000 GPU NVIDIA Rubin au sein d'un même site, et jusqu'à 960 000 GPU dans un déploiement multi-sites. Mark Lohmeyer, VP et directeur général de l'infrastructure IA chez Google Cloud, a résumé l'enjeu : "La prochaine décennie de l'IA sera façonnée par la capacité des entreprises à faire tourner leurs charges de travail les plus exigeantes sur une infrastructure vraiment intégrée et optimisée pour l'IA." Ces annonces ont un impact direct sur les secteurs fortement réglementés, comme la finance et la santé, qui butent régulièrement sur des contraintes de souveraineté des données. Google et NVIDIA y répondent avec plusieurs initiatives concrètes : les modèles Gemini fonctionnant sur GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en préversion sur Google Distributed Cloud, ce qui permet aux organisations de garder les modèles frontier entièrement dans leur environnement contrôlé, au plus près de leurs données sensibles. La sécurité est assurée par NVIDIA Confidential Computing, un protocole de chiffrement matériel qui protège les données d'entraînement et les prompts y compris vis-à-vis des opérateurs cloud eux-mêmes. Pour les environnements cloud public multi-tenant, des VM Confidential G4 équipées de GPU NVIDIA RTX PRO 6000 Blackwell sont également introduites en préversion, marquant la première offre de confidential computing cloud pour des GPU Blackwell. Cette collaboration s'inscrit dans une course plus large à l'optimisation de l'inférence, alors que les coûts opérationnels de l'IA générative restent un frein majeur à son adoption industrielle. Au-delà du matériel, le partenariat couvre aussi la couche logicielle : NVIDIA Nemotron 3 Super est désormais disponible sur la Gemini Enterprise Agent Platform, permettant aux développeurs de construire des systèmes agentiques complexes capables de raisonner, planifier et agir en chaîne. L'ensemble de la plateforme NVIDIA sur Google Cloud est optimisé pour les familles de modèles Gemini et Gemma. Avec des clusters dépassant le million de GPU et une ambition affichée de simplifier le déploiement d'IA souveraine, Google et NVIDIA repositionnent l'infrastructure cloud non plus comme un simple fournisseur de puissance de calcul, mais comme un levier stratégique pour les entreprises qui veulent industrialiser l'IA sans sacrifier performance, coût ou conformité réglementaire.

UELes entreprises européennes des secteurs réglementés (finance, santé) disposent désormais d'options d'infrastructure IA souveraine compatibles avec les exigences RGPD, réduisant un frein concret à l'industrialisation de l'IA en Europe.

InfrastructureActu
1 source
Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant
95VentureBeat AI 

Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant

Cirrascale Cloud Services a annoncé lors du Google Cloud Next 2026 à Las Vegas un accord élargi avec Google Cloud pour déployer le modèle Gemini en mode entièrement déconnecté, sur des serveurs physiques isolés d'internet. Cirrascale devient ainsi le premier fournisseur de cloud spécialisé à proposer le modèle phare de Google sous forme d'appliance privée, installée soit dans les centres de données de Cirrascale, soit directement dans les locaux du client. Le système repose sur un serveur certifié Google, fabriqué par Dell, équipé de huit GPU Nvidia et protégé par des mécanismes de calcul confidentiel. Une préversion est disponible immédiatement, avec une disponibilité générale attendue en juin ou juillet 2026. Dave Driggers, PDG de Cirrascale, a insisté sur un point clé : il s'agit du modèle Gemini complet, sans aucune restriction ni version allégée, déployé dans un environnement où les données d'entrée comme de sortie restent entièrement sous le contrôle du client. Fait notable sur le plan technique, les poids du modèle résident uniquement en mémoire volatile : dès que l'alimentation est coupée, le modèle disparaît sans laisser de trace persistante. Cette annonce répond à un problème structurel qui bloque depuis des années les secteurs régulés comme la finance, la santé, la défense et les administrations publiques. Ces organisations devaient jusqu'ici choisir entre accéder aux modèles les plus puissants via des API cloud publiques, au risque d'exposer leurs données sensibles à l'infrastructure d'un tiers, ou se contenter de modèles open source moins performants hébergés en interne. Le déploiement Cirrascale entend supprimer ce compromis. Driggers décrit l'escalade du problème de confiance : après les inquiétudes sur les données propriétaires confiées aux hyperscalers, les entreprises ont pris conscience que les prompts et les réponses générées étaient également récupérés par ces mêmes plateformes pour alimenter leurs propres systèmes, ce qui a rendu la demande de souveraineté totale incontournable. Cette évolution s'inscrit dans un mouvement plus large de migration des modèles d'IA frontier hors des centres de données des grands hyperscalers, vers les infrastructures propres des clients, ce qui représente une rupture avec la logique cloud dominante de la dernière décennie. Driggers distingue explicitement cette offre des déploiements on-premises proposés par Microsoft Azure avec les modèles OpenAI ou par AWS Outposts : dans ces cas, les modèles restent liés à l'infrastructure de leurs éditeurs. Ici, Google ne possède pas le matériel, et son modèle fonctionne en dehors de tout réseau Google. Pour le géant de Mountain View, accepter ce niveau de délégation sur son modèle le plus avancé traduit une stratégie commerciale claire : conquérir les marchés réglementés qui lui étaient jusqu'ici fermés, quitte à renoncer au contrôle direct de l'inférence.

UECe mode de déploiement air-gap répond directement aux exigences du RGPD et de l'AI Act en matière de souveraineté des données, ouvrant potentiellement Gemini aux administrations publiques, établissements de santé et institutions financières européennes soumis à des contraintes strictes de localisation et d'isolation des données.

💬 Le truc des poids uniquement en mémoire volatile, c'est la partie que je trouve la plus maligne. Parce que le blocage dans les secteurs régulés c'était pas juste "mes données sortent du réseau", c'était aussi "quelqu'un peut extraire ou copier le modèle", et là, coupe l'alimentation, ça disparaît. Google accepte de perdre le contrôle de l'inférence de son meilleur modèle pour aller chercher des marchés qui lui étaient fermés depuis des années. Ça, c'est un vrai mouvement.

InfrastructureOpinion
1 source
Claude Code s'étend à toute l'organisation via Amazon Bedrock
96AWS ML Blog 

Claude Code s'étend à toute l'organisation via Amazon Bedrock

Anthropic et Amazon Web Services ont annoncé le lancement de Claude Cowork dans Amazon Bedrock, une intégration qui permet aux entreprises de déployer l'application de bureau Claude directement depuis leur infrastructure AWS. Concrètement, les utilisateurs téléchargent l'application Claude Desktop sur leur machine, puis le service informatique de l'entreprise pousse une configuration centralisée via des outils de gestion de parc comme Jamf, Microsoft Intune ou Group Policy. L'inférence est entièrement routée vers Amazon Bedrock dans les régions AWS choisies par l'organisation, sans licence par siège payée à Anthropic : la facturation est à la consommation, intégrée à l'accord AWS existant. L'application donne accès aux projets, artefacts, mémoire, import-export de fichiers, connecteurs distants et serveurs MCP. Les fonctionnalités nécessitant l'infrastructure Anthropic, onglet Chat, Computer Use, Skills Marketplace, sont exclues de cette offre. L'enjeu dépasse la seule productivité des développeurs. Claude Cowork vise à étendre l'adoption de l'IA à l'ensemble des travailleurs de la connaissance d'une organisation : chefs de produit, analystes, équipes juridiques ou RH peuvent déléguer de la recherche documentaire, de l'analyse de fichiers, de la génération de rapports, sans quitter leur environnement de travail habituel. Pour les entreprises soumises à des contraintes réglementaires strictes, l'argument central est la souveraineté des données : Amazon Bedrock ne stocke pas les prompts, fichiers, inputs ou outputs d'outils, ni les réponses du modèle, et ne les utilise pas pour entraîner des modèles fondamentaux. Les profils d'inférence régionaux, cross-régionaux ou globaux permettent de choisir le niveau de résidence des données adapté à chaque juridiction. Cette annonce s'inscrit dans une dynamique plus large de déploiement entreprise de l'IA générative, où les grands groupes cherchent à concilier puissance des modèles de pointe et exigences de conformité interne. AWS et Anthropic approfondissent ainsi un partenariat stratégique amorcé il y a plusieurs années, Amazon ayant investi plusieurs milliards de dollars dans Anthropic. Pour les organisations qui utilisent déjà Claude Code dans Bedrock pour leurs équipes techniques, la même configuration peut être réutilisée pour déployer Cowork. L'intégration avec IAM, VPC endpoints, CloudTrail et CloudWatch permet une gouvernance et une observabilité natives. La prochaine étape probable : étendre les capacités des serveurs MCP disponibles dans ce contexte géré, afin de connecter Claude aux systèmes métier internes sans compromettre l'isolation réseau.

UELes entreprises européennes soumises au RGPD peuvent déployer Claude à grande échelle via leurs régions AWS européennes, avec résidence des données garantie et sans que les prompts ou fichiers soient utilisés pour entraîner des modèles.

OutilsOutil
1 source
Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée
97Le Big Data 

Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée

Mozilla a officialisé le 16 avril 2026 le lancement de Thunderbolt, une interface d'IA conçue pour un déploiement entièrement auto-hébergé en entreprise. Développé par MZLA Technologies, la filiale responsable de Thunderbird, l'outil se positionne comme un "client d'IA souverain" capable de se connecter à des modèles existants, Claude, Codex, DeepSeek ou tout modèle open source, via des API compatibles OpenAI ou ACP. Il repose sur Haystack, un framework open source reconnu pour la construction de pipelines d'IA modulaires. Thunderbolt est disponible en applications natives sur Windows, macOS, Linux, iOS, Android et en version web, avec le code source React accessible sur GitHub. Un audit de sécurité est actuellement en cours avant une mise en production à grande échelle, et Mozilla encourage déjà les entreprises à explorer des déploiements sur site avec des licences adaptées. L'argument central de Thunderbolt est son architecture entièrement locale : les données restent sur l'infrastructure de l'entreprise, notamment via une base SQLite hors ligne, sans transit vers des services cloud externes. Le système intègre un chiffrement de bout en bout et des contrôles d'accès au niveau des appareils. Pour les organisations soumises au RGPD, aux réglementations sectorielles strictes, santé, finance, défense, ou qui manipulent des données sensibles, c'est un différenciateur décisif face aux offres de Microsoft, Google ou OpenAI qui centralisent tout. Thunderbolt prend en charge les usages devenus standards : chat, recherche, automatisation et workflows multi-appareils, ce qui limite la friction à l'adoption pour des équipes habituées aux outils IA grand public. Ce lancement s'inscrit dans une stratégie plus large que Mozilla a formulée dès novembre 2025 : "faire pour l'IA ce que nous avons fait pour le web", c'est-à-dire construire un écosystème ouvert et décentralisé face aux géants de la Big AI. Mozilla.ai, sa branche dédiée à l'IA open source, soutient en parallèle le développement d'outils et de modèles ouverts. Le pari de Mozilla est celui de l'interopérabilité contre l'enfermement propriétaire, la même philosophie qui a fondé Firefox contre Internet Explorer à l'époque. La demande pour des solutions souveraines ne cesse de croître en Europe notamment, portée par des impératifs réglementaires et une méfiance croissante envers la dépendance aux hyperscalers américains. Thunderbolt arrive donc au bon moment sur un marché B2B où la souveraineté technologique est devenue un critère d'achat à part entière, et non plus un simple argument marketing.

UEThunderbolt offre aux entreprises européennes soumises au RGPD et aux réglementations sectorielles (santé, finance, défense) une solution concrète pour déployer des workflows IA en conservant leurs données sur leur propre infrastructure, sans dépendance aux hyperscalers américains.

💬 Mozilla qui sort l'artillerie lourde sur la souveraineté IA, ça fait plaisir à voir. L'architecture tout-local avec SQLite hors ligne, l'audit sécu avant le lancement, la compatibilité OpenAI API pour brancher ses propres modèles, bon, sur le papier c'est exactement ce que les DSI européens réclamaient. Reste à voir si ça tient face aux besoins réels des grandes boîtes, parce qu'entre une démo GitHub propre et un déploiement santé à 5 000 users, il y a souvent un gouffre.

OutilsOutil
1 source
Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant
98FrenchWeb 

Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant

Sephora a annoncé fin mars à Las Vegas, lors de la conférence Shoptalk Spring, un partenariat stratégique avec OpenAI pour intégrer ChatGPT au cœur de son programme de fidélité Beauty Insider. Ce qui distingue cet accord de simples expérimentations marketing : l'enseigne confie à l'IA les données de ses membres, un actif considéré comme l'un des plus précieux de l'entreprise. Sephora inaugure ainsi ce que l'industrie commence à appeler le « shopping agentique », où l'IA ne se contente plus de répondre à des questions mais agit pour le compte de l'utilisateur. Pour les quelque 34 millions de membres Beauty Insider aux États-Unis, cela signifie potentiellement une expérience d'achat entièrement personnalisée, pilotée par un assistant capable d'analyser l'historique d'achats, les préférences de marques et les tendances beauté en temps réel. L'enjeu dépasse la simple recommandation produit : en laissant une IA accéder aux données comportementales de ses clients les plus fidèles, Sephora parie que la personnalisation de masse peut devenir un avantage concurrentiel durable face à la concurrence en ligne et aux plateformes comme Amazon. Ce partenariat s'inscrit dans une vague plus large de grands distributeurs qui cherchent à monétiser leurs données first-party à l'heure où les cookies tiers disparaissent. OpenAI, de son côté, accélère son virage vers les applications commerciales après avoir sécurisé des financements massifs, et le retail de luxe constitue un terrain d'expansion stratégique. La question qui reste ouverte est celle de la gouvernance : confier des données clients sensibles à un tiers comme OpenAI soulève des interrogations sur la souveraineté des données et la conformité au RGPD pour les opérations européennes de Sephora.

UESephora, entreprise française du groupe LVMH, confie des données clients sensibles à OpenAI, ce qui soulève des questions concrètes de conformité RGPD pour ses opérations européennes.

BusinessOpinion
1 source
99NVIDIA AI Blog 

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

NVIDIA et ses partenaires industriels investissent Hannover Messe 2026, le salon phare de l'industrie manufacturière qui se tient du 20 au 24 avril à Hanovre, en Allemagne, pour y présenter ce qu'ils considèrent comme la prochaine révolution de la production : l'usine pilotée par l'intelligence artificielle. Au programme, des démonstrations concrètes couvrant l'informatique accélérée, la simulation physique en temps réel, les agents autonomes et les robots humanoïdes opérant en environnement industriel. Parmi les temps forts, l'annonce de l'Industrial AI Cloud, l'un des plus grands centres d'IA d'Europe, construit en Allemagne par Deutsche Telekom sur infrastructure NVIDIA. Des géants comme SAP, Siemens, ABB, Dassault Systèmes, Cadence ou encore Synopsys y participent, aux côtés d'acteurs spécialisés comme Agile Robots, Wandelbots et PhysicsX. EDAG, prestataire indépendant d'ingénierie, a par ailleurs annoncé le déploiement de sa plateforme de métavers industriel "metys" sur ce cloud souverain, ciblant l'automobile et l'ingénierie lourde. L'enjeu est considérable : l'industrie manufacturière mondiale fait face à une pression simultanée sur les cycles de conception, les coûts opérationnels et la disponibilité de main-d'œuvre qualifiée. L'IA n'est plus une option expérimentale mais un levier de compétitivité immédiat. Les jumeaux numériques à l'échelle d'une usine entière, construits sur les bibliothèques Omniverse de NVIDIA et le standard ouvert OpenUSD, permettent désormais de simuler, tester et optimiser des lignes de production en continu, sans interruption physique. ABB, par exemple, intègre ces outils dans sa suite Genix pour analyser la performance des équipements et accélérer la recherche de causes de pannes via des agents IA. Pour les ingénieurs, la simulation physique en temps réel change radicalement le processus de conception : là où des heures de calcul étaient nécessaires, des résultats apparaissent en secondes. Cette offensive de NVIDIA dans l'industrie s'inscrit dans une stratégie plus large visant à faire de l'informatique accélérée le socle de la transformation industrielle européenne. Le concept de "souveraineté numérique" est central : face aux craintes européennes de dépendance aux clouds américains, l'Industrial AI Cloud positionné en Allemagne répond à une demande politique autant qu'économique. CUDA-X, Omniverse, les modèles ouverts Nemotron et les puces NVIDIA équipent désormais les logiciels des éditeurs les plus influents du secteur, de Siemens à Dassault Systèmes, créant un écosystème interdépendant difficile à contourner. Dell, IBM, Lenovo et PNY complètent l'offre avec des systèmes accélérés déployables de la périphérie jusqu'aux datacenters. La prochaine étape, déjà visible à Hanovre, est l'intégration de robots humanoïdes dans les chaînes de production, un marché où NVIDIA entend jouer un rôle d'infrastructure aussi structurant que dans l'IA générative.

UEL'Industrial AI Cloud inauguré en Allemagne par Deutsche Telekom sur infrastructure NVIDIA, avec la participation de Dassault Systèmes et Siemens, offre aux industriels européens une infrastructure cloud souveraine pour déployer l'IA en production.

InfrastructureActu
1 source
100Next INpact 

☕️ Mozilla drague les entreprises avec un client IA open source, Thunderbolt

MZLA, la filiale de Mozilla qui développe le client de messagerie Thunderbird depuis 2020, a annoncé le lancement de Thunderbolt, un client d'intelligence artificielle open source destiné aux entreprises. Disponible dès maintenant sur GitHub, Thunderbolt est conçu pour s'intégrer avec le framework open source Haystack et proposera des applications natives sur macOS, Windows, Linux, iOS et Android. Il se positionne comme un « client d'IA souverain » permettant le chat, la recherche, l'automatisation et les flux de travail multi-appareils via une interface auto-hébergée et extensible. L'outil est agnostique en matière de modèle de langage : il supporte Claude d'Anthropic, GPT d'OpenAI, Mistral et OpenRouter, via les protocoles MCP et ACP. MZLA précise toutefois qu'aucun point d'accès public pour l'inférence n'est encore fourni, et recommande l'usage d'Ollama ou llama.cpp pour une inférence locale gratuite. Thunderbolt répond à une demande croissante des équipes techniques en entreprise : disposer d'une interface unifiée pour accéder à leurs infrastructures IA internes, qu'elles soient hébergées localement ou chez un fournisseur cloud, sans dépendre d'un outil propriétaire. L'architecture pensée « local first » et la compatibilité avec les principaux fournisseurs de modèles en font une alternative crédible aux interfaces propriétaires comme Claude.ai ou ChatGPT Enterprise, avec l'avantage du contrôle total des données et de la personnalisation. Pour les DSI et les équipes soucieuses de souveraineté numérique, c'est un argument de poids. Mozilla s'inscrit ainsi dans une stratégie plus large de repositionnement autour de l'IA, après avoir déjà misé sur la transparence et l'ouverture avec des initiatives comme Mozilla.ai. En confiant ce projet à MZLA plutôt qu'à la fondation, l'organisation cherche à adresser directement le marché professionnel tout en restant fidèle à ses valeurs open source. Thunderbolt arrive dans un écosystème déjà animé par des outils comme Open WebUI ou AnythingLLM, mais bénéficie de la légitimité et de la communauté de développeurs que Mozilla a construites autour de Thunderbird depuis plus de vingt ans.

UEThunderbolt, avec son architecture 'local first' et son support de Mistral, répond directement aux enjeux de souveraineté numérique des DSI européens soumis au RGPD.