Aller au contenu principal

Azure· sujet

139 articlesmis à jour le 2026-06-09

Suivi des annonces IA d'Azure : services cloud, intégration des modèles OpenAI, outils pour développeurs et déploiements en entreprise.

Hub d'actualité sur Azure, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA
55 10%
articles (vs 30j préc.)
4.3%
de la couverture IA
Souvent associé à

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant Azure. Voir le Baromètre IA complet

À retenir · 30 derniers jours

Azure, c'est l'infrastructure cloud de Microsoft, et l'un des endroits où une grande partie de l'IA mondiale tourne concrètement. Quand une entreprise « utilise l'IA », il y a de fortes chances qu'un modèle s'exécute sur les serveurs Azure, que ce soit pour entraîner un système ou pour le faire répondre à des millions de requêtes. C'est cette plomberie, peu visible mais décisive, qui fait d'Azure une pièce centrale du secteur.

Sa position durable tient à trois choses. Microsoft y vend la puissance de calcul, les modèles prêts à l'emploi (les siens, ceux d'OpenAI, et d'autres), et les outils pour brancher tout ça sur les logiciels que les entreprises utilisent déjà, à commencer par Office et Windows. Cette intégration profonde dans le monde professionnel est son principal atout face à Google et Amazon. En face, sa dépendance historique à OpenAI évolue : Microsoft développe ses propres modèles et muscle son autonomie.

Pour un usage pro, l'enjeu est concret : choisir Azure, c'est arbitrer entre commodité, coût, souveraineté des données et risque de dépendance à un seul fournisseur.

Dans ce hub, on suit l'évolution de l'offre IA d'Azure, ses rapports de force avec ses partenaires et concurrents, et ce que cela change pour les organisations qui s'appuient dessus.

Toute l'actualité Azure

Flux automatique. Articles classés par pertinence, agrégés en continu.

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations
1AWS ML Blog OutilsOutil

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations

Amazon Web Services a présenté un système d'automatisation de la déclaration de sinistre initiale (FNOL, ou "First Notice of Loss") combinant deux de ses technologies : le SDK open source Strands Agents et l'outil Amazon Bedrock AgentCore Browser Tool. Le dispositif s'appuie également sur Amazon Nova Act, un client capable d'interpréter des instructions en langage naturel pour piloter des interfaces web. Concrètement, Nova Act orchestre les interactions avec les portails de gestion de sinistres, ouvrir un dossier non traité, déclencher une analyse d'images, tandis que les agents construits avec Strands Agents appliquent les règles métier propres à l'assurance : interprétation des preuves, corrélation entre différents types de médias, évaluation de la complexité du dossier. Les modèles de fondation sont servis via Amazon Bedrock, et les sessions de navigation sont gérées dans des environnements Chrome isolés, avec enregistrement et visualisation en temps réel pour garantir la traçabilité. L'enjeu est considérable pour les compagnies d'assurance. À chaque déclaration de sinistre, les experts reçoivent un ensemble hétérogène d'informations non structurées : photos prises sur le terrain, vidéos panoramiques des dégâts, documents scannés, notes dictées ou enregistrées. Avant même de pouvoir exercer leur jugement, ils doivent naviguer dans des portails, vérifier l'exhaustivité des pièces justificatives et interpréter manuellement chaque élément. Les estimations sectorielles indiquent que cette phase de validation représente une part significative du temps d'un expert lors du traitement initial d'un dossier. Lors de pics de sinistres, catastrophes naturelles, vagues saisonnières, ces délais s'accumulent, créent des files d'attente et dégradent l'expérience client. Le système proposé délivre aux experts des dossiers pré-analysés, avec les preuves étiquetées et contextualisées, prêts pour la prise de décision plutôt que pour la validation. Cette initiative s'inscrit dans un mouvement plus large d'automatisation des processus assurantiels par l'IA générative, un secteur où les grands acteurs du cloud, AWS, Microsoft Azure, Google Cloud, se livrent une concurrence intense pour conquérir les équipes claims et underwriting. L'approche d'AWS est notable car elle ne cherche pas à remplacer l'expert humain mais à éliminer le travail répétitif d'écran, en préservant la supervision et l'auditabilité. Les données d'intake étiquetées deviennent également un actif opérationnel durable, utilisable pour affiner le routage des dossiers, détecter des patterns de fraude ou améliorer les workflows sur l'ensemble du cycle de vie des sinistres. La prochaine étape naturelle sera l'intégration avec des systèmes de gestion de sinistres existants comme Guidewire ou Duck Creek, où la valeur de l'automatisation multimodale sera pleinement testée à l'échelle.

UELes assureurs européens pourraient adopter ces outils pour automatiser le traitement initial des sinistres, mais la conformité RGPD et la souveraineté des données constituent des obstacles réglementaires à évaluer avant tout déploiement.

1 source
Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code
2Next INpact 

Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code

Microsoft a dû désactiver l'accès à plus de 70 de ses propres dépôts GitHub suite à une campagne d'attaques nommée « Miasma », révélée début juin 2026. Parmi les dépôts compromis figurent des projets critiques comme « Azure/functions-action », utilisé pour déployer du code sur Azure Functions, et le framework Durable Task, décrit comme « utilisé activement en production par de nombreuses équipes d'ingénierie au sein de Microsoft ». L'entreprise de sécurité StepSecurity a identifié le vecteur précis : un commit malveillant poussé dans le dépôt Azure/durabletask via un compte de contributeur piraté, ajoutant cinq fichiers conçus pour s'exécuter automatiquement dans quatre environnements de développement. Le code s'active dès qu'un développeur ouvre le dépôt dans Claude Code, Gemini CLI, Cursor ou VS Code, avec pour objectif de dérober des identifiants. L'impact est particulièrement insidieux car l'attaque ne repose sur aucune faille technique de GitHub ou de npm, mais exploite la confiance accordée aux flux de publication légitimes. En s'emparant des identifiants d'un mainteneur, les attaquants ont pu demander un jeton OIDC GitHub valide, publier une version infectée avec une provenance SLSA authentique, et contourner ainsi les scanners de sécurité conventionnels qui l'ont traitée comme une mise à jour de routine. Comme le souligne l'entreprise Cloudsmith, « le ver s'est fondu dans les flux de travail légitimes » : les paquets malveillants portaient des signatures cryptographiques valides, indiscernables de celles d'un éditeur légitime. Les développeurs qui clonent un dépôt ne sont pas exposés, mais ceux qui l'ouvrent directement dans leur IDE l'étaient. Paradoxalement, c'est l'équipe de sécurité de Microsoft elle-même qui avait détecté Miasma en premier, non pas dans ses propres projets, mais chez Red Hat le 2 juin, où 32 paquets npm du périmètre @redhat-cloud-services avaient été modifiés dans plus de 90 versions. StepSecurity relie cette campagne à une attaque antérieure, « Mini Shai-Hulud », menée par le groupe TeamPCP, les deux opérations partageant un même domaine de commande et contrôle. Le compte piraté chez Microsoft est le même dont les identifiants avaient servi lors d'une attaque contre PyPI le 19 mai. Cette série d'incidents illustre une tendance de fond : la compromission des identifiants développeurs comme point d'entrée privilégié dans la chaîne d'approvisionnement logicielle, un vecteur d'autant plus difficile à contrer que les outils de vérification d'intégrité comme SLSA ne distinguent pas un éditeur authentique d'un attaquant ayant volé ses clés.

UELes développeurs européens utilisant Claude Code, Gemini CLI, Cursor ou VS Code sont directement exposés au vol de credentials s'ils ont ouvert des dépôts Microsoft ou Red Hat compromis dans ces environnements.

💬 Ce qui me frappe, c'est pas l'ampleur de la campagne. C'est que tous nos garde-fous, SLSA, les signatures cryptographiques, les pipelines de provenance qu'on impose aux projets OSS depuis des années, sont aveugles face à des credentials volés : la signature est valide, les scanners voient du vert, et t'es quand même compromis. C'est le genre de faille qu'on va pas résoudre avec un outil de plus dans la chaîne.

SécuritéOpinion
1 source
Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles
3AWS ML Blog 

Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles

Amazon Web Services a introduit une fonctionnalité appelée Cross-Region Inference (CRIS) dans Amazon Bedrock, son service d'IA générative managé, permettant aux entreprises européennes de router automatiquement leurs requêtes d'inférence vers plusieurs régions AWS au sein de zones géographiques prédéfinies. Concrètement, lorsqu'une application envoie une requête à un modèle comme Claude d'Anthropic ou un modèle Amazon Nova, CRIS peut la rediriger dynamiquement vers la région disposant de la meilleure capacité disponible, tout en maintenant les données dans un périmètre géographique contrôlé. Pour l'Europe, AWS propose des profils EU CRIS dont toutes les régions de destination sont situées exclusivement au sein de l'Union européenne. Les données transmises restent chiffrées et circulent uniquement sur le réseau privé AWS, sans jamais transiter par l'internet public. Ce mécanisme répond à un problème concret que rencontrent les entreprises européennes : la saturation des capacités de calcul GPU en période de forte demande, qui se traduit par des latences élevées ou des erreurs de disponibilité. En distribuant les requêtes sur plusieurs régions, les applications deviennent plus résilientes aux pics de charge et aux pannes locales. Du point de vue réglementaire, les profils EU CRIS sont conçus pour faciliter la conformité au RGPD, puisque le traitement reste borné à l'UE, un critère déterminant pour les secteurs soumis à des exigences strictes de résidence des données comme la finance, la santé ou les services publics. AWS souligne également que certains modèles sont disponibles à tarif réduit via les profils globaux CRIS, ajoutant un argument économique à l'argument technique. La pression réglementaire européenne sur le traitement des données par des fournisseurs cloud américains s'est intensifiée ces dernières années, notamment après les décisions de la CJUE sur les transferts transatlantiques de données. Les grands hyperscalers comme AWS, Google Cloud et Microsoft Azure ont tous investi massivement dans des infrastructures européennes et des offres de souveraineté pour répondre à ces contraintes. CRIS s'inscrit dans cette logique : plutôt que de forcer les clients à choisir une seule région et à subir ses limitations de capacité, AWS propose une abstraction qui optimise automatiquement tout en respectant les frontières réglementaires. La prochaine étape logique sera l'extension de ces profils géographiques à d'autres zones comme le Moyen-Orient ou l'Asie-Pacifique, et l'intégration de contrôles plus fins permettant aux entreprises de définir elles-mêmes les régions autorisées selon leurs obligations contractuelles ou sectorielles.

UELa fonctionnalité EU CRIS d'AWS Bedrock permet aux entreprises européennes de maintenir leurs traitements d'inférence IA exclusivement dans les frontières de l'UE, facilitant la conformité RGPD pour les secteurs finance, santé et services publics soumis à des exigences strictes de résidence des données.

InfrastructureOpinion
1 source
Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2
4InfoQ AI 

Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2

Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme Azure dédiée au déploiement d'équipes d'agents IA autonomes pour la recherche scientifique. C'est cette même plateforme qui a piloté le développement de Majorana 2, une puce quantique topologique affichant une fiabilité multipliée par 1 000 par rapport aux générations précédentes, avec des durées de vie de qubits atteignant 20 secondes. Microsoft fixe désormais à 2029 l'horizon d'un ordinateur quantique opérationnel à grande échelle, soit deux fois plus tôt que son calendrier initial. L'enjeu est considérable : un ordinateur quantique suffisamment fiable permettrait de résoudre des problèmes inaccessibles aux supercalculateurs classiques, notamment en chimie moléculaire, en cryptographie ou en optimisation logistique. En mettant ses agents IA au service de la conception de hardware quantique, Microsoft franchit une étape symbolique forte : l'IA ne se contente plus d'assister les chercheurs humains, elle orchestre elle-même des cycles d'expérimentation scientifique bout en bout. La course au quantique s'intensifie avec Google, IBM et plusieurs startups comme IonQ ou PsiQuantum comme principaux concurrents. Microsoft mise sur une architecture topologique reposant sur les qubits de Majorana, jugés intrinsèquement plus stables que les qubits supraconducteurs privilégiés par ses rivaux. La combinaison de cette approche matérielle distinctive et d'une plateforme IA agentique directement accessible sur Azure positionne Microsoft comme un acteur à double avantage dans la prochaine phase de la compétition quantique mondiale.

UELa disponibilité sur Azure en Europe donne aux laboratoires et entreprises de recherche de l'UE un accès à cette plateforme d'IA agentique pour la recherche scientifique, sans impact réglementaire ou institutionnel direct pour la France.

InfrastructureActu
1 source
Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides
5MarkTechPost 

Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides

Microsoft a dévoilé la semaine dernière MAI-Transcribe-1.5, la deuxième génération de son modèle de reconnaissance vocale développé en interne. Ce système de transcription automatique prend en charge 43 langues, contre 25 pour la version précédente, avec dix-huit nouvelles langues ajoutées sans dégradation des performances, dont le bengali, le tamoul, le télougou côté Asie du Sud, et l'ukrainien, le grec ou le catalan côté Europe. Sur le benchmark multilingue FLEURS, Microsoft revendique la première place parmi les modèles du marché. Sur le classement Artificial Analysis, le modèle affiche un taux d'erreur par mot (WER) de 2,4 %, ce qui le place troisième dans un champ concurrentiel. En vitesse, il est capable de transcrire une heure d'audio en moins de 15 secondes et se révèle jusqu'à 5 fois plus rapide que des modèles comparables comme Gemini 3.1, Scribe v2 ou GPT-4o-Transcribe sur des fichiers longs. MAI-Transcribe-1.5 est intégré à Copilot, Teams, GitHub et Dynamics 365 Contact Centre, et disponible via Foundry, la plateforme de modèles de Microsoft. La fonctionnalité qui mérite le plus d'attention est le « keyword biasing », ou biais par entités nommées. Les transcripteurs génériques trébuchent régulièrement sur les vocabulaires métiers, noms propres, termes médicaux, acronymes internes, précisément là où les erreurs coûtent le plus cher. MAI-Transcribe-1.5 permet de fournir jusqu'à 200 mots-clés personnalisés que le modèle prend en compte lors de la transcription, sans forcer mécaniquement les correspondances mais en s'appuyant sur le contexte. Résultat : une réduction de 30 % du WER sur FLEURS lorsque ce mécanisme est activé. Sur les réunions d'entreprise, dans les centres d'appels ou les environnements de santé, cette capacité change concrètement la qualité des transcriptions produites. La détection automatique de la langue parlée, sans paramétrage manuel, complète l'ensemble pour des flux d'entrée non structurés. La course aux modèles de transcription s'est considérablement intensifiée depuis que OpenAI a popularisé Whisper et que des acteurs comme AssemblyAI ou ElevenLabs ont investi le segment entreprise. Microsoft, fort de son infrastructure Azure et de son intégration profonde dans les outils de productivité, cherche à imposer une solution maison plutôt que de dépendre de fournisseurs tiers. Le passage de 25 à 43 langues, avec une couverture renforcée des langues d'Asie du Sud, reflète aussi une ambition de croissance sur des marchés où l'anglais n'est pas dominant. Pour les équipes qui traitent des archives audio volumineuses en batch, médias, justice, santé, support client, un facteur de vitesse de 5x sur les fichiers longs n'est pas anecdotique : il réduit directement les coûts d'infrastructure et les délais de traitement à grande échelle.

UELes entreprises européennes intégrées à l'écosystème Microsoft (Teams, Dynamics 365) bénéficieront directement de ces gains de précision et de vitesse, avec un support renforcé des langues européennes comme le grec, le catalan et l'ukrainien.

OutilsOpinion
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
6VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source
Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle
7InfoQ AI 

Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle

Karthik Ramgopal et Prince Valluri, ingénieurs chez LinkedIn, ont présenté leur approche pour déployer l'intelligence artificielle à grande échelle au sein d'une organisation de plusieurs milliers de développeurs. Plutôt que de laisser chaque équipe construire ses propres solutions en silo, ils ont mis en place une couche d'abstraction commune reposant sur le protocole MCP (Model Context Protocol) pour orchestrer des agents, structurer le contexte et sécuriser l'accès aux outils internes. Cette architecture a permis de déployer concrètement trois types d'agents en production : des agents de génération de code, des agents d'observation système et des agents de test d'interface utilisateur. L'enjeu est considérable pour les grandes entreprises technologiques : sans infrastructure partagée, chaque équipe réinvente la roue et les agents IA restent des expérimentations isolées sans impact à l'échelle. En centralisant l'orchestration et la gestion du contexte via une plateforme commune, LinkedIn parvient à transformer l'IA en véritable moteur d'exécution engineering, capable d'automatiser des tâches complexes comme les tests UI ou la surveillance de systèmes distribués, avec des garanties de sécurité homogènes. Cette initiative s'inscrit dans une tendance de fond : les grandes entreprises tech passent du stade des prototypes d'agents IA à celui des déploiements industriels, ce qui exige des équipes plateformes dédiées. Le protocole MCP, porté initialement par Anthropic et rapidement adopté par l'industrie, s'impose comme standard d'interopérabilité entre agents et outils. LinkedIn, filiale de Microsoft, bénéficie par ailleurs d'un accès privilégié aux modèles GPT-4o via Azure, ce qui accélère ces expérimentations à une échelle que peu d'entreprises peuvent atteindre.

UELes équipes d'ingénierie européennes peuvent s'inspirer de cette architecture MCP pour structurer leurs propres déploiements d'agents IA à l'échelle, le protocole MCP s'imposant comme standard industriel d'interopérabilité.

💬 MCP en prod chez LinkedIn sur des milliers de devs, c'est le signal qu'on attendait pour que le protocole bascule vraiment en standard industriel. Ce qui est intéressant là-dedans, c'est pas la tech en elle-même (Anthropic a bien bossé le design), c'est l'architecture plateforme : une couche commune au lieu que chaque équipe réinvente ses propres outils d'orchestration dans son coin. Reste à voir ce que ça donne pour les boîtes qui n'ont pas Azure et GPT-4o derrière.

InfrastructureOpinion
1 source
Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA
8Next INpact 

Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA

Le Canard Enchaîné a affirmé, dans son édition du 2 juin 2026, que Doctolib transmettait les données de ses utilisateurs à Microsoft, Anthropic et Google dans le but d'entraîner leurs grands modèles de langage. L'article vise notamment l'assistant de consultation que la licorne française commercialise depuis 2024 auprès des professionnels de santé. Ce service écoute les consultations médicales, avec l'accord du patient, pour générer automatiquement comptes-rendus et courriers. Or, les documents contractuels de Doctolib consultés par la rédaction de Next confirment que Microsoft Azure, Anthropic et Google Irlande figurent bien dans la liste des « sous-traitants ultérieurs » de l'entreprise, avec pour service déclaré la « fourniture du modèle de LLM » et pour finalité l'« analyse et création de contenu à des fins d'automatisation de tâches ». Doctolib dément catégoriquement que ces données médicales servent à entraîner les modèles de ses fournisseurs. Selon un porte-parole de l'entreprise, Microsoft, Anthropic et Google interviennent exclusivement comme prestataires techniques, sur instructions strictes de Doctolib, dans un cadre contractuel qui leur interdit d'utiliser les données à d'autres fins que la fourniture du service. En clair : les LLM américains sont bien mobilisés pour faire tourner les fonctionnalités de transcription et de synthèse, mais les notes médicales ne serviraient pas à affiner leurs poids. Sur le plan du stockage, Doctolib assure que les données sont hébergées sur des serveurs européens certifiés Hébergement de Données de Santé. Le Canard Enchaîné objecte toutefois que la justice américaine peut contraindre ces entreprises à transmettre des données outre-Atlantique, indépendamment de leur localisation physique. Cette controverse s'inscrit dans un débat plus large sur la souveraineté numérique des données de santé en France. Doctolib, qui traite des dizaines de millions de consultations, est une infrastructure critique du système de soins français, et toute ambiguïté sur le traitement de ses données sensitives déclenche une réaction immédiate. La tension entre innovation IA et protection des données médicales est structurelle : utiliser des LLM de pointe implique presque inévitablement de s'appuyer sur les infrastructures des géants américains, Microsoft, Google ou Anthropic, faute d'alternatives européennes comparables. Le RGPD et la certification HDS imposent des garanties, mais le Cloud Act américain crée un angle mort juridique que ni les certifications ni les contrats ne peuvent complètement combler. L'affaire illustre la fragilité des engagements de confidentialité dès lors que les données de santé transitent, même partiellement, par des acteurs soumis au droit américain.

UELes données médicales de millions de patients français transitent par des sous-traitants américains soumis au Cloud Act, créant une faille juridique structurelle que ni la certification HDS ni le RGPD ne peuvent entièrement combler.

💬 La distinction que fait Doctolib entre "faire tourner" et "entraîner" un LLM, elle est réelle. Mais ça n'enlève pas le truc qui gratte : tes comptes-rendus médicaux passent par des serveurs d'entreprises soumises au Cloud Act, et aucun label HDS ne te protège de ça. C'est une impasse structurelle, pas une faute de Doctolib spécifiquement.

ÉthiqueReglementation
1 source
Microsoft a désormais son propre modèle de raisonnement
9Next INpact 

Microsoft a désormais son propre modèle de raisonnement

Lors de sa conférence BUILD, Microsoft a dévoilé MAI-Thinking-1, son premier modèle de raisonnement maison, marquant une rupture significative dans la stratégie IA de l'entreprise. Ce modèle de type Mixture of Experts (MoE) embarque 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l'équivalent d'environ 600 pages. Sur les benchmarks mathématiques AIME 2025 et 2026, il atteint respectivement 97 % et 94,5 %. Microsoft affirme qu'il égale Claude Opus 4.6 sur SWE-Bench Pro, un benchmark de codage, et qu'il a été préféré à Claude Sonnet 4.6 dans des évaluations indépendantes en aveugle conduites par Surge. CNBC rapporte même une démonstration affichant des résultats supérieurs à GPT-5.5 d'OpenAI, avec un coût dix fois inférieur sur des données McKinsey. Le modèle est actuellement en préversion privée via Microsoft Foundry, intégré à GitHub Copilot Enterprise, avec une version pour Azure Confidential Computing annoncée. La famille MAI s'enrichit également de six autres modèles : MAI-Image-2.5 et sa variante Flash pour la génération d'images (déployés dans PowerPoint et OneDrive), et MAI-Transcribe-1.5, présenté comme le meilleur modèle de transcription au monde. Jusqu'à présent, Microsoft occupait surtout le rôle de distributeur de modèles tiers, OpenAI via Copilot, Anthropic via ses assistants, sans disposer de sa propre capacité de raisonnement avancée. L'émergence de MAI-Thinking-1 change fondamentalement cette donne. Pour les entreprises utilisant Azure et GitHub Copilot Enterprise, cela signifie un accès à un modèle de raisonnement compétitif sans dépendre d'un fournisseur externe. Le fait que Microsoft insiste sur un entraînement "from scratch" à partir de données commercialement licenciées, sans distillation depuis d'autres modèles, est aussi un argument juridique et commercial fort pour les clients soucieux de conformité et de propriété intellectuelle. Ce pivot s'explique par une évolution du paysage des alliances. OpenAI, dans lequel Microsoft a investi plusieurs milliards de dollars, suit désormais sa propre trajectoire de manière nettement plus autonome. Anthropic, de son côté, a considérablement gagné en influence, notamment dans les usages développeurs. Pour Redmond, rester dans une position de simple relais devenait stratégiquement risqué. En développant sa propre gamme MAI, Microsoft affirme une indépendance technologique qui lui permet de négocier différemment avec ses partenaires LLM tout en proposant une offre intégrée de bout en bout. La prochaine étape sera la disponibilité générale du modèle et la publication de sa tarification complète sur les tokens de raisonnement, deux inconnues qui détermineront son adoption réelle face à des concurrents déjà bien établis.

UELes entreprises européennes utilisant Azure ou GitHub Copilot Enterprise pourront accéder à un modèle de raisonnement compétitif entraîné sur données commercialement licenciées, un argument de conformité pertinent face aux exigences de l'AI Act et du RGPD.

💬 Microsoft en simple distributeur d'OpenAI et d'Anthropic, ça ne pouvait pas durer. MAI-Thinking-1, c'est leur sortie de cette dépendance, et vu la trajectoire d'OpenAI ces derniers mois, on comprend le timing. Les benchmarks sont convaincants sur le papier (97% sur AIME, parité avec Claude Opus sur SWE-Bench), mais le vrai test, c'est la tarification complète et la sortie de preview.

OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises
10The Information AI 

OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises

Le même mardi, OpenAI et Microsoft ont chacun organisé un événement dédié aux entreprises, dans deux villes différentes. OpenAI a tenu une présentation à New York pour promouvoir de nouveaux outils d'intelligence artificielle à destination des professionnels, dont plusieurs conçus pour des secteurs précis comme le trading d'actions et la banque d'investissement. En parallèle, Microsoft tenait son propre événement à San Francisco, où l'entreprise a dévoilé du nouveau matériel informatique spécifiquement pensé pour l'IA, notamment un ordinateur de bureau et des modèles d'IA destinés aux entreprises clientes. Ces annonces simultanées illustrent la pression croissante que subissent les responsables des achats technologiques dans les grandes entreprises. La multiplication des offres d'IA entreprise rend les décisions d'achat de plus en plus complexes : chaque acteur majeur du secteur déploie désormais des équipes de consultants, souvent rebaptisés "forward-deployed engineers", pour convaincre les directions informatiques d'adopter leurs solutions. Pour OpenAI, dont le modèle économique repose largement sur les contrats d'entreprise, s'imposer sur ce segment est devenu une priorité stratégique et financière majeure. Le marché de l'IA en entreprise est aujourd'hui perçu comme un terrain sur lequel Anthropic, concurrent direct d'OpenAI, jouit d'une longueur d'avance et d'une image particulièrement solide auprès des directions techniques et des grands comptes. Microsoft, actionnaire historique d'OpenAI et partenaire de longue date des entreprises via Azure et la suite Office, occupe quant à lui une position établie dans cet écosystème. L'offensive conjointe des deux alliés témoigne néanmoins de l'intensification de la bataille pour capter les budgets informatiques des grandes organisations, à mesure que l'IA générative passe du stade expérimental à celui de l'outil opérationnel intégré dans les processus métier.

UELes entreprises européennes devront arbitrer entre les offres concurrentes d'OpenAI et Microsoft pour leurs budgets IA, avec une complexité croissante des décisions d'achat technologique à mesure que l'IA générative s'intègre dans les processus métier.

💬 Deux événements le même jour, deux villes différentes : OpenAI et Microsoft ne laissent plus rien au hasard sur le segment entreprise. Le signal, c'est qu'ils sentent tous les deux la pression d'Anthropic, qui s'est imposé chez les équipes techniques sans avoir eu besoin de tout ce cirque commercial. Reste à voir si les "forward-deployed engineers" suffisent à renverser ça.

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud
11NVIDIA AI Blog 

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

NVIDIA et Microsoft ont dévoilé lors de Microsoft Build un partenariat élargi pour déployer une pile technologique unifiée dédiée à l'IA agentique, couvrant les PC Windows, le cloud Azure et les environnements locaux. Jensen Huang, fondateur et PDG de NVIDIA, est intervenu en direct depuis Taipei aux côtés de Satya Nadella pour présenter les nouvelles initiatives. Au programme : les PC RTX Spark et les stations DGX Station for Windows, l'accélération GPU de Microsoft Fabric, les modèles ouverts NVIDIA sur Microsoft Foundry, et le runtime sécurisé NVIDIA OpenShell intégré à GitHub Copilot. RTX Spark cible les laptops et petits ordinateurs de bureau avec 1 pétaflop de performance IA, jusqu'à 128 Go de mémoire unifiée et une autonomie toute la journée, avec des systèmes attendus cet automne chez Microsoft Surface, ASUS, Dell, HP, Lenovo et MSI. La DGX Station for Windows, propulsée par le superchip NVIDIA GB300 Grace Blackwell Ultra, offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops en FP4, capable de faire tourner des modèles jusqu'à 1 billion de paramètres, avec des livraisons prévues au quatrième trimestre 2026 chez ASUS, Dell, GIGABYTE, HP, MSI et Supermicro. Ce partenariat marque un tournant dans la course à l'IA agentique d'entreprise en proposant, pour la première fois, une chaîne complète allant du matériel personnel à l'infrastructure cloud. Pour les développeurs et les entreprises, cela signifie pouvoir construire, affiner et déployer des agents IA directement sur Windows sans dépendre exclusivement du cloud. Les modèles Claude d'Anthropic tournent désormais nativement sur les systèmes Blackwell Ultra dans Azure, avec une disponibilité annoncée dans les prochaines semaines. Sur Microsoft Foundry, le nouveau NVIDIA Nemotron 3 Ultra, conçu pour le raisonnement de longue durée dans des tâches de codage, de recherche et de workflows d'entreprise, est disponible dès ce mois-ci, accompagné de Nemotron 3.5 ASR pour la reconnaissance vocale et Nemotron 3.5 Content Safety pour la modération de contenu. Ce rapprochement intervient alors que l'ensemble de l'industrie cherche à concrétiser la promesse des agents IA autonomes capables d'exécuter des tâches complexes sur la durée. NVIDIA, dont les GPU sont devenus incontournables dans les data centers, étend son influence jusqu'au bureau et au PC personnel, concurrençant indirectement Apple Silicon et AMD sur le terrain de l'inférence locale. Le runtime OpenShell, sécurisé nativement, répond aux exigences de gouvernance des grandes entreprises qui hésitent encore à confier des tâches autonomes à des agents. L'intégration des bibliothèques CUDA-X comme cuDF, cuOpt et NeMo directement accessibles aux agents ouvre la voie à des workflows scientifiques plus complexes, notamment avec le modèle Cosmos 3 pour la simulation du monde physique et les modèles météo Earth-2 disponibles via Microsoft Planetary Computer Pro.

UELes entreprises européennes utilisant Azure et Windows bénéficieront d'une chaîne de déploiement IA unifiée du PC personnel au cloud, réduisant la dépendance exclusive à l'infrastructure cloud pour les workflows agentiques.

💬 Jensen Huang qui s'invite en hologramme depuis Taipei pendant le keynote de Satya, c'est le genre de mise en scène qui cache souvent un partenariat creux. Là, non : la DGX Station sous Windows avec 748 Go de mémoire cohérente et 20 pétaflops, c'est du concret pour les boîtes qui refusent de tout mettre dans Azure. Reste à voir si les prix seront accessibles à autre chose qu'aux grands comptes, mais l'idée d'une chaîne complète du laptop au datacenter sans changer de stack, ça change vraiment quelque chose pour les équipes qui font tourner des agents en prod.

InfrastructureActu
1 source
Microsoft dévoile sept modèles d’IA maison pour s’émanciper d’OpenAI et partir chasser sur les terres d’Anthropic et de Google
12Frandroid 

Microsoft dévoile sept modèles d’IA maison pour s’émanciper d’OpenAI et partir chasser sur les terres d’Anthropic et de Google

Lors de sa conférence Build, Microsoft a annoncé le lancement de sept modèles d'intelligence artificielle développés entièrement en interne, marquant une rupture stratégique significative avec sa dépendance historique à OpenAI. Cette famille de modèles maison, dévoilée devant les développeurs et partenaires de l'entreprise, couvre différentes tailles et usages, des modèles légers optimisés pour les appareils locaux aux versions plus puissantes destinées au cloud Azure. Microsoft positionne explicitement ces modèles face à Claude d'Anthropic et aux modèles Gemini de Google. Ce pivot vers l'autonomie technologique représente un changement profond pour les entreprises clientes de Microsoft, qui disposent désormais d'une alternative aux modèles OpenAI au sein même de l'écosystème Azure et Copilot. Pour les développeurs, cela signifie plus de choix, potentiellement des coûts différents et une moindre exposition aux aléas de la relation Microsoft-OpenAI. Pour l'industrie, c'est la confirmation que les grands éditeurs tech ne veulent plus sous-traiter le cerveau de leurs produits IA. Ce mouvement s'inscrit dans une tension croissante entre Microsoft et OpenAI, deux entités liées par un partenariat de plusieurs milliards de dollars mais dont les intérêts divergent à mesure qu'OpenAI se rapproche d'une structure commerciale indépendante. En bâtissant sa propre capacité de modélisation, Microsoft réduit sa vulnérabilité stratégique et entre directement en compétition avec les laboratoires qu'elle finançait indirectement. La guerre des modèles fondamentaux se joue désormais aussi dans les couloirs de Redmond.

UELes entreprises et développeurs européens utilisant Azure et Copilot disposent désormais d'alternatives aux modèles OpenAI, avec des implications potentielles sur les coûts et la dépendance stratégique au sein de l'écosystème Microsoft.

💬 C'est le genre de move qu'on voyait venir depuis que la relation Microsoft-OpenAI a commencé à craquer en public. Sept modèles d'un coup, du léger pour les appareils locaux au costaud pour Azure, ça ressemble moins à une annonce produit qu'à une déclaration d'indépendance. Bon, faut encore que ces modèles tiennent la route, parce que s'attaquer frontalement à Claude et Gemini, c'est pas anodin.

LLMsOpinion
1 source
IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA
13Le Big Data 

IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA

Snowflake et Anthropic ont annoncé le 2 juin 2026, lors du Snowflake Summit 2026, un renforcement significatif de leur partenariat autour de l'IA d'entreprise. Concrètement, les modèles Claude d'Anthropic s'intègrent désormais plus profondément dans Snowflake Cortex AI, notamment pour alimenter Snowflake Cortex Code et Snowflake Intelligence. L'objectif est de permettre aux organisations de déployer des agents IA directement dans leur environnement de données existant, sans avoir à externaliser ou déplacer des données sensibles. Des entreprises comme Block, Indeed, Carvana, Notion ou eSentire utilisent déjà cette combinaison en production. Christian Kleinerman, EVP Product chez Snowflake, a indiqué que Snowflake Cortex Code serait devenu le produit à la croissance la plus rapide de toute l'histoire du groupe. L'enjeu central de ce partenariat est la gouvernance : les entreprises des secteurs réglementés, finance, santé, cybersécurité, retail, ne peuvent pas déployer l'IA sur des données critiques sans garanties fortes en matière de sécurité, de conformité et de traçabilité. En combinant la couche de gouvernance et de contrôle d'accès de Snowflake avec les capacités de raisonnement de Claude, les deux groupes proposent une architecture où le modèle devient une extension native de la plateforme data de l'entreprise plutôt qu'un outil externe. Cela change concrètement le profil de risque de l'IA générative pour les décideurs : Block automatise ainsi des workflows de conformité pour Square et Cash App, eSentire automatise des analyses SOC de niveau 1 pour libérer ses analystes humains des tâches répétitives, et Carvana optimise ses opérations logistiques et financières grâce à cette architecture. Ce renforcement s'inscrit dans la continuité d'un accord élargi signé fin 2025, qui avait déjà permis l'intégration native de Claude dans Cortex AI sur les principaux clouds. Le marché de l'IA d'entreprise est en train de basculer d'une phase d'expérimentation vers des déploiements opérationnels à grande échelle, et plusieurs acteurs, Microsoft avec Azure OpenAI, Google avec Vertex AI, AWS avec Bedrock, se livrent une concurrence intense pour capter cette demande. Snowflake, en tant que plateforme data indépendante du cloud, joue une carte différente : celle de la neutralité et de la gouvernance centralisée. Anthropic, de son côté, accélère sa distribution en entreprise via des partenariats stratégiques plutôt que par une offre cloud propriétaire. Les prochaines étapes du partenariat devraient porter sur l'extension de Claude Marketplace au sein de l'écosystème Snowflake, ouvrant la porte à un modèle de distribution plus large pour les modèles d'Anthropic dans les environnements data d'entreprise.

UELes entreprises européennes des secteurs réglementés (finance, santé, cybersécurité) disposent d'une architecture permettant de déployer Claude directement dans leur environnement de données existant, sans externaliser de données sensibles, un argument clé pour la conformité RGPD.

OutilsOpinion
1 source
Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock
14AWS ML Blog 

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

OpenAI et Amazon Web Services ont rendu officiellement disponibles, début juin 2026, GPT-5.5, GPT-5.4 et l'agent de code Codex sur Amazon Bedrock, un mois après l'annonce de leur partenariat élargi. Les trois modèles sont désormais accessibles en production via le catalogue Bedrock, avec une tarification identique à celle pratiquée directement par OpenAI, sans frais supplémentaires. GPT-5.5, le modèle le plus avancé de la gamme, excelle dans les tâches agentiques complexes : rédaction et débogage de code sur de grandes bases, analyse de données, génération de documents, et exécution autonome de séquences multi-étapes. Codex, l'agent de développement logiciel d'OpenAI, comptabilise plus de 5 millions d'utilisateurs hebdomadaires et est désormais accessible via l'application Codex, le CLI, ainsi que les intégrations IDE pour Visual Studio Code, JetBrains et Xcode, avec toute l'inférence routée par Bedrock. Pour les entreprises, cette disponibilité générale représente un changement opérationnel concret : les appels aux modèles OpenAI s'intègrent désormais dans les engagements AWS existants, comptent dans les crédits contractuels, et bénéficient des mécanismes de gouvernance déjà en place, notamment les permissions IAM, l'isolation réseau via VPC et PrivateLink, le chiffrement KMS et les journaux d'audit CloudTrail. Bedrock garantit par ailleurs une file d'attente isolée par client avec gestion automatique de la capacité, ce qui assure une performance prévisible même sous forte charge. Fait notable pour les secteurs réglementés : les prompts et réponses ne sont pas utilisés pour entraîner les modèles, et ne sont pas partagés avec OpenAI. Amgen, le géant pharmaceutique, a déjà exprimé son intérêt, son directeur technique Sean Bruich soulignant la qualité et la consistance de GPT-5.5 pour des contextes où la précision scientifique est critique. Ce déploiement s'inscrit dans une dynamique de consolidation entre les grands fournisseurs de cloud et les développeurs de modèles frontière. OpenAI cherche à multiplier les canaux de distribution pour ses modèles, en s'appuyant sur les infrastructures cloud existantes pour atteindre des clients enterprise déjà engagés avec AWS, plutôt que de les forcer à migrer vers une API directe. Pour Amazon, intégrer GPT-5.5 aux côtés de ses propres modèles Titan et des offres Anthropic et Mistral déjà disponibles sur Bedrock renforce le positionnement de la plateforme comme guichet unique du marché des modèles. L'enjeu sous-jacent est la rétention des dépenses cloud enterprise : en faisant compter l'usage d'OpenAI dans les engagements AWS, les deux sociétés créent une friction supplémentaire contre la migration vers Azure ou Google Cloud, où GPT-5.5 est également accessible.

UELes entreprises européennes sous contrat AWS peuvent désormais accéder aux modèles GPT-5.5 et Codex via Bedrock avec des garanties de conformité adaptées au RGPD (données non utilisées pour l'entraînement, isolation réseau VPC, chiffrement KMS), facilitant l'adoption dans les secteurs réglementés.

Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant
15AWS ML Blog 

Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant

Amazon Web Services vient d'annoncer une combinaison technique qui pourrait transformer le déploiement de grands modèles de langage en production : l'utilisation conjointe d'Amazon FSx for Lustre, de NVIDIA GPUDirect Storage (GDS) et d'une nouvelle technique de quantification appelée TurboQuant. Concrètement, charger un modèle comme Llama 3.1 405B, soit environ 800 gigaoctets de poids en BF16, prend aujourd'hui entre 10 et 20 minutes avec une infrastructure classique. Avec GDS sur les nouvelles instances P6 et P6e d'AWS, propulsées par l'architecture NVIDIA Blackwell, ce délai tombe à quelques secondes. Le flagship P6e UltraServer concentre 72 GPU Blackwell dans un seul domaine NVLink, avec 13,4 téraoctets de mémoire HBM3e et 360 pétaflops de calcul en FP8. Le problème que résout cette approche est fondamental pour l'industrie de l'inférence à grande échelle. Dans le pipeline traditionnel, les poids du modèle transitent séquentiellement depuis le stockage vers la RAM CPU, sont désérialisés, éventuellement quantifiés, puis copiés un par un vers chaque GPU via le bus PCIe. Pendant tout ce temps, parfois vingt minutes, les GPU les plus chers de l'infrastructure restent inactifs. GPUDirect Storage court-circuite entièrement ce chemin : les checkpoints du modèle sont pré-découpés en fragments sur FSx for Lustre, et les huit GPU d'une instance lisent leurs fragments en parallèle directement dans leur mémoire HBM, sans jamais passer par le CPU ni le PCIe. L'impact est immédiat sur trois métriques critiques : la latence au premier token lors d'un démarrage à froid, la réactivité de l'autoscaling lors des pics de charge, et le coût d'infrastructure lié aux GPU qui attendent. Cette annonce s'inscrit dans une course à l'optimisation de l'inférence LLM qui s'est intensifiée depuis l'émergence de modèles à plusieurs centaines de milliards de paramètres. Des frameworks comme vLLM ont certes amélioré le chargement parallèle des poids depuis la version 0.19 et son moteur V1, mais les données continuent d'emprunter le CPU et le bus PCIe, une limitation structurelle que GDS supprime à la racine. AWS introduit simultanément TurboQuant, une technique de mise en cache KV qui permet d'augmenter significativement la taille des fenêtres de contexte disponibles sur ces instances. Ces deux avancées combinées positionnent AWS comme un acteur offensif sur le marché de l'infrastructure d'inférence, face à des concurrents comme Google Cloud et Azure qui développent leurs propres accélérateurs et solutions de stockage haute performance pour répondre aux mêmes contraintes.

UELes entreprises européennes déployant des LLMs à grande échelle sur AWS pourront réduire significativement leurs coûts d'infrastructure liés aux GPU inactifs au démarrage, avec un impact direct sur la compétitivité des services d'inférence en Europe.

InfrastructureOpinion
1 source
Le jour d'indépendance de Microsoft dans l'IA
16The Information AI 

Le jour d'indépendance de Microsoft dans l'IA

Microsoft a ouvert mardi sa conférence annuelle Build 2026 à San Francisco, devant quelque 2 500 développeurs d'applications. L'événement prend cette année une coloration particulière : il survient deux mois après ce que la presse américaine a qualifié de "découplage conscient" entre Microsoft et OpenAI, et sert de vitrine officielle aux modèles d'intelligence artificielle que Microsoft développe désormais en propre, sans s'appuyer sur la technologie du créateur de ChatGPT ni sur celle d'Anthropic. Pour Microsoft, l'enjeu est de taille : prouver que sa division IA peut rivaliser de façon autonome sur un marché où OpenAI et Anthropic s'imposent comme références. Proposer ses propres modèles aux développeurs signifie réduire sa dépendance structurelle vis-à-vis d'un partenaire avec lequel les tensions se sont accumulées, tout en reprenant la main sur la chaîne de valeur. Pour les milliers d'équipes qui bâtissent des applications sur l'écosystème Microsoft, le signal est clair : une alternative interne existe désormais. Cette émancipation s'inscrit dans une reconfiguration profonde des alliances dans l'industrie de l'IA. Microsoft a investi des milliards de dollars dans OpenAI depuis 2019, intégrant ses modèles dans Azure, Copilot et Office. Mais la multiplication des acteurs, la montée en puissance des modèles open source et les frictions stratégiques entre les deux entreprises ont accéléré l'ambition de Redmond de contrôler sa propre pile technologique. Build 2026 marque symboliquement ce tournant.

UELes entreprises et développeurs européens qui s'appuient sur l'écosystème Microsoft (Azure, Copilot, Office 365) doivent anticiper une transition vers des modèles maison, avec des implications potentielles sur les contrats, les performances et la roadmap de leurs intégrations IA.

💬 Ça faisait longtemps que ça devait arriver. Mettre des milliards dans OpenAI tout en leur confiant toute la chaîne de valeur, c'est le genre de pari qui finit par se retourner contre toi. Bon, sur le papier c'est la bonne décision, mais leurs modèles maison vont devoir tenir la route face à Claude et GPT, pas juste sur les benchmarks.

BusinessOpinion
1 source
Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google
17Le Big Data 

Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google

Anthropic a annoncé le 18 mai 2026 l'acquisition de Stainless, une startup new-yorkaise fondée en 2022 par Alex Rattray, ancien ingénieur de Stripe. Spécialisée dans l'automatisation des SDK et des connecteurs API, Stainless avait bâti en quelques années une position de référence dans l'écosystème IA. Selon The Information, l'opération dépasserait les 300 millions de dollars. La technologie de Stainless transforme des spécifications d'API en kits de développement logiciel prêts pour la production, compatibles avec Python, Go, Java, Kotlin et TypeScript. Son avantage distinctif est la maintenance automatique de ces SDK : à chaque évolution d'une API, les bibliothèques sont mises à jour sans intervention humaine. Anthropic utilisait déjà Stainless depuis les premières versions de son API Claude, mais la startup fournissait également ses outils à OpenAI, Google, Replicate, Runway et Cloudflare. Ces clients perdront l'accès aux produits hébergés de Stainless, dont son générateur de SDK, bien qu'ils conservent la propriété des SDK déjà générés et le droit de les modifier. Cette acquisition positionne Anthropic sur un terrain stratégique qui dépasse le simple rachat technologique. Dans le marché de l'IA agentique, la valeur ne réside plus uniquement dans la puissance des modèles, mais dans leur capacité à se connecter à des systèmes externes, des bases de données et des logiciels métiers. Les SDK, serveurs MCP et connecteurs sont précisément la couche technique qui rend cette connexion possible. En intégrant Stainless, Anthropic renforce toute son infrastructure développeur autour de Claude et prive simultanément ses concurrents directs d'un fournisseur jusqu'ici commun. OpenAI et Google, qui comptaient sur ces outils, devront désormais trouver ou développer des alternatives, ce qui représente un coût de friction non négligeable pour leurs équipes techniques et leurs clients. Cette opération s'inscrit dans une logique que les grandes plateformes cloud ont perfectionnée depuis des décennies. AWS, Microsoft Azure et Google Cloud n'ont pas construit leur domination uniquement sur l'infrastructure brute, mais surtout sur des couches d'outils qui fidélisent les développeurs et rendent le changement de fournisseur coûteux. Anthropic applique aujourd'hui cette même recette au marché des agents IA, en s'appropriant une infrastructure critique juste au moment où la compétition s'intensifie. La société pousse parallèlement son protocole MCP, qui standardise la communication entre agents IA et applications tierces, et Stainless vient directement renforcer cette pile. Le rachat transforme Anthropic d'un fabricant de modèles en véritable opérateur d'infrastructure pour développeurs, un positionnement qui pourrait peser lourd dans la consolidation qui s'annonce dans le secteur.

UELes développeurs européens utilisant les outils Stainless via OpenAI ou Google devront migrer vers des alternatives, renforçant leur dépendance à l'écosystème Anthropic/Claude.

💬 Le vrai coup, c'est pas les 300 millions, c'est qu'OpenAI et Google perdent leur fournisseur de SDK commun du jour au lendemain. La maintenance automatique des bibliothèques à chaque évolution d'API, c'est invisible, mais c'est exactement le genre de truc qui colle aux mains et crée une vraie dépendance. Avec MCP qui pousse en parallèle, Anthropic est en train de bâtir la couche infrastructure dont on ne sort pas facilement.

5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer
18VentureBeat AI 

5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer

Les entreprises ont dépensé des milliards pour sécuriser des GPU à tout prix, et la facture est désormais présentée. Selon Gartner, l'infrastructure IA représente 401 milliards de dollars de nouvelles dépenses en 2025, mais des audits terrain révèlent une réalité bien plus sombre : le taux d'utilisation moyen des GPU en entreprise stagne à 5 %. Pendant deux ans, la panique du « GPU scramble » a poussé DSI et directions financières à constituer des réserves de capacité sous des cycles d'amortissement de trois à cinq ans. Ces actifs sont désormais des coûts fixes inscrits aux bilans, indépendamment de leur usage effectif. Les chiffres du Q1 2026 confirment le basculement : dans le baromètre de VentureBeat, le critère « accès aux GPU » est passé de 20,8 % à 15,4 % en un seul trimestre comme moteur principal des décisions d'achat, tandis que le coût par inférence et le TCO (coût total de possession) bondissaient de 34 % à 41 %, dépassant la performance pure comme critère dominant. À 5 % d'utilisation, l'arithmétique est brutale : pour chaque dollar investi en silicium, 95 centimes partent directement dans la marge des fournisseurs cloud. Dans n'importe quel autre département, un taux de gaspillage de 95 % serait un motif de licenciement ; dans l'infrastructure IA, on appelait ça de la « préparation ». Les grands groupes comme Intuit, Mastercard ou Pfizer, qui bénéficiaient de relations privilégiées avec AWS, Azure et GCP pour sécuriser des réservations de capacité, se sont retrouvés riches en GPU mais pauvres en production : des équipes internes paralysées par la gouvernance des données, la gravité des données et une immaturité architecturale persistante ont empêché toute valorisation réelle de ces ressources. Le discours dominant sur la rareté du silicium a servi d'écran commode pour masquer cette inefficacité structurelle. Ce virage marque la fin de l'ère du chèque en blanc. Le passage à une tarification à l'usage en 2026 transforme les architectures héritées des phases pilotes, pensées avec des tokens en coûts fixes, en véritables passifs financiers. Les agents en contexte long et les pipelines de récupération complexes, construits quand les tokens étaient un coût noyé dans des licences forfaitaires, deviennent intenables sous une facturation mesuréé. L'inférence n'est plus un projet tactique : c'est un modèle économique stratégique dont les unités économiques sont, pour la plupart des entreprises, encore insoutenables. La question n'est plus de savoir si les investissements passés étaient justifiés, mais comment extraire un retour mesurable d'une infrastructure déjà déployée avant que les cycles d'amortissement ne l'emportent.

UELes entreprises européennes investies en infrastructure GPU sont exposées au même risque de sous-utilisation à 5 %, avec des cycles d'amortissement sur 3-5 ans qui transforment ces actifs en passifs financiers au moment où le marché bascule vers une tarification à l'usage.

💬 5 % d'utilisation, c'est le genre de stat qui ferait renvoyer n'importe quel responsable infra dans un département classique. La panique du GPU scramble a servi de couverture : on achetait du silicium pour ne pas rater le train, sans se demander si les équipes data étaient capables d'en faire quelque chose. Le basculement vers le pay-as-you-go va transformer ces réserves en passifs, et ça va faire des dégâts.

InfrastructureOpinion
1 source
Voici comment se structure le nouvel accord entre Microsoft et OpenAI
19The Verge AI 

Voici comment se structure le nouvel accord entre Microsoft et OpenAI

Microsoft et OpenAI ont annoncé lundi une refonte majeure de leur accord de partenariat, mettant fin à plusieurs années d'exclusivité qui liait le déploiement des services d'OpenAI à l'infrastructure cloud Azure de Microsoft. Le changement le plus significatif autorise désormais OpenAI à proposer ses produits et services sur l'ensemble des fournisseurs cloud, ouvrant la voie à des accords avec AWS, Google Cloud ou d'autres concurrents de Microsoft. La séparation a été décrite par les deux parties comme étant remarquablement cordiale, malgré les tensions accumulées au fil des années. Ce rééquilibrage représente un tournant stratégique considérable pour l'industrie de l'IA. OpenAI gagne en indépendance et en flexibilité commerciale, pouvant désormais négocier avec n'importe quel opérateur cloud selon les besoins de ses clients. Pour Microsoft, qui a investi plusieurs milliards de dollars dans OpenAI depuis 2019, cela signifie la perte d'un avantage concurrentiel majeur, même si la relation commerciale entre les deux entreprises se poursuit sous une forme révisée. Le partenariat Microsoft-OpenAI a traversé de multiples turbulences ces dernières années : désaccords entre dirigeants, renégociations contractuelles répétées, et frustrations autour des capacités d'infrastructure nécessaires pour entraîner et déployer des modèles toujours plus puissants. L'arrivée d'OpenAI dans le statut de société à but lucratif et sa montée en puissance comme acteur autonome rendaient inévitable cette évolution vers plus d'indépendance, dans un secteur où la guerre des clouds est désormais indissociable de la course à l'IA.

UELes entreprises européennes utilisant des services d'IA générative disposent désormais d'une plus grande flexibilité pour choisir leur fournisseur cloud, réduisant la dépendance à un opérateur unique.

BusinessOpinion
1 source
Dopés par l’IA, les géants du cloud projettent 700 milliards $ d’investissements en 2026
20Next INpact 

Dopés par l’IA, les géants du cloud projettent 700 milliards $ d’investissements en 2026

Microsoft, Meta, Amazon et Alphabet ont publié simultanément leurs résultats financiers le 29 avril 2026, tous supérieurs aux attentes, et tous accompagnés d'une révision à la hausse de leurs prévisions d'investissement dans l'intelligence artificielle. Additionnées, leurs enveloppes atteignent désormais 700 milliards de dollars pour l'année en cours. Google Cloud se distingue particulièrement avec un chiffre d'affaires bondissant de 12,26 à 20 milliards de dollars sur le seul premier trimestre, soit une progression de 60 %, adossée à un carnet de commandes dépassant 460 milliards. La maison mère Alphabet clôture le trimestre à près de 110 milliards de chiffre d'affaires, en hausse de 22 % sur un an, portée aussi bien par la publicité search (+20 %, à 60 milliards) que par YouTube. Amazon Web Services, leader mondial du cloud, enregistre pour sa part une croissance de 28 % sur un an, à 37,6 milliards de dollars, sa meilleure performance depuis quinze trimestres. Le trimestre a également vu AWS signer une trentaine de partenariats stratégiques avec OpenAI, Anthropic, NVIDIA, Meta, l'armée américaine et le groupe français Veolia. Ces chiffres signalent que l'IA n'est plus seulement un poste de dépenses pour les géants du cloud : elle est devenue un moteur de revenus mesurable. Sundar Pichai indique que les modèles Gemini traitent désormais plus de 16 milliards de tokens par minute via l'API, soit une hausse de 60 % par rapport au trimestre précédent. Chez Amazon, la division Bedrock aurait traité sur ce seul trimestre plus de tokens que sur toutes les années précédentes cumulées. Au-delà du cloud stricto sensu, l'IA irrigue désormais la publicité programmatique et les outils d'automatisation des achats médias, élargissant son impact à l'ensemble de l'écosystème numérique. Amazon monte également en puissance dans les semiconducteurs, avec une activité projetée à plus de 20 milliards de dollars annuels, positionnant le groupe comme fournisseur et premier client de ses propres puces. Cette publication groupée intervient dans un contexte où les interrogations sur une éventuelle bulle spéculative autour de l'IA se multiplient, sans que les résultats opérationnels ne les confirment pour l'instant. Les quatre groupes ont massivement investi dans les data centers et les infrastructures GPU depuis 2023, des dépenses qui commencent à se traduire en revenus récurrents via les contrats cloud longue durée. La concentration des investissements autour de quelques acteurs, AWS, Google Cloud, Azure, renforce une logique d'oligopole qui rend l'entrée sur ce marché structurellement difficile pour les challengers. Les prochains trimestres seront déterminants pour confirmer si cette dynamique tient face aux incertitudes tarifaires américaines et à la montée en puissance de concurrents chinois comme Alibaba Cloud ou Huawei.

UELe groupe français Veolia a signé un partenariat stratégique avec AWS, et la concentration des 700 milliards d'investissements autour de quelques acteurs américains renforce la dépendance structurelle des entreprises et États européens vis-à-vis du cloud américain.

💬 700 milliards, c'est plus une promesse, c'est du revenu qui rentre. AWS à +28 %, Google Cloud à +60 % sur un seul trimestre, bon, le discours sur la bulle spéculative devient difficile à tenir. Le vrai sujet, c'est l'oligopole qui se cimente, et pour les entreprises et États européens, cette dépendance va coûter cher.

BusinessOpinion
1 source
AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises
21Le Big Data 

AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises

Amazon Web Services et OpenAI ont annoncé le 28 avril 2026 un élargissement significatif de leur partenariat, avec l'intégration des derniers modèles d'OpenAI directement dans Amazon Bedrock, la plateforme d'IA managée d'AWS. Concrètement, les entreprises clientes d'AWS peuvent désormais accéder aux modèles OpenAI via les mêmes API et outils que ceux déjà utilisés pour Anthropic, Meta, Mistral AI ou Cohere, sans changer d'environnement ni multiplier les contrats. Dans la foulée, AWS a annoncé le lancement de Codex sur Bedrock, l'agent de développement logiciel d'OpenAI déjà utilisé par plus de 4 millions de personnes chaque semaine, ainsi que le déploiement des Amazon Bedrock Managed Agents, une couche d'orchestration pour automatiser des workflows complexes en production. Pour les grandes organisations, l'enjeu dépasse le simple accès à de nouveaux modèles. Ce qui change concrètement, c'est la possibilité d'utiliser l'IA d'OpenAI sans renoncer aux garanties de sécurité et de conformité d'AWS : gestion des accès via IAM, chiffrement des données, journalisation avec CloudTrail, connectivité sécurisée via PrivateLink. Ces couches de gouvernance, déjà en place pour d'autres modèles Bedrock, s'appliquent désormais aux modèles OpenAI sans reconfiguration. À cela s'ajoute un avantage financier non négligeable : les usages OpenAI peuvent être imputés directement aux engagements cloud AWS existants, évitant la multiplication des fournisseurs et des lignes budgétaires. Pour les directions techniques et achats des grandes entreprises, c'est précisément le type de friction qui bloquait le passage du pilote à la production à grande échelle. Cette annonce s'inscrit dans une compétition acharnée entre les grands clouds pour capter les budgets IA des entreprises. Azure bénéficie depuis plusieurs années d'une exclusivité de fait sur OpenAI via l'investissement de Microsoft, qui détient une participation estimée à plusieurs dizaines de milliards de dollars dans la startup. En ouvrant Bedrock aux modèles OpenAI, AWS brouille cette distinction et positionne sa plateforme comme un guichet unique multi-modèles, où l'entreprise choisit le meilleur outil pour chaque cas d'usage sans dépendre d'un fournisseur unique. Pour OpenAI, l'accord élargit considérablement sa distribution commerciale au-delà de l'écosystème Microsoft, à une clientèle enterprise déjà ancrée dans AWS. Les prochains mois diront si cette convergence accélère l'adoption de Codex dans les équipes de développement, un marché où GitHub Copilot d'Amazon et Microsoft se livrent déjà une bataille directe.

UELes entreprises européennes déjà clientes d'AWS peuvent désormais déployer les modèles OpenAI en production via leur infrastructure cloud existante, avec les couches de conformité AWS déjà en place, supprimant un frein réglementaire majeur à l'adoption à grande échelle.

BusinessOpinion
1 source
Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité
22VentureBeat AI 

Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité

Amazon Web Services a lancé mardi l'une des offensives les plus significatives de ses vingt ans d'histoire dans l'IA d'entreprise. Lors d'un événement à San Francisco intitulé "What's Next with AWS", le cloud d'Amazon a annoncé simultanément l'intégration des modèles OpenAI les plus puissants sur sa plateforme Bedrock, le lancement d'un nouveau framework de développement agentique, d'un outil de productivité desktop appelé Amazon Quick, et l'extension d'Amazon Connect en une famille de quatre solutions d'IA ciblant les chaînes d'approvisionnement, le recrutement, la santé et l'expérience client. Les modèles GPT-5.4 et GPT-5.5 d'OpenAI sont désormais accessibles via Bedrock en préversion limitée, avec une disponibilité générale attendue dans les prochaines semaines. Ces annonces sont intervenues exactement vingt-quatre heures après la restructuration publique du partenariat exclusif entre OpenAI et Microsoft, qui libère pour la première fois OpenAI de toute restriction de distribution vers d'autres fournisseurs cloud. Le PDG d'AWS, Matt Garman, a qualifié l'accord de "partenariat majeur", précisant que les clients réclamaient les modèles OpenAI sur AWS "depuis les tous premiers jours". L'impact concret pour les entreprises est immédiat. Anthony Liguori, vice-président et ingénieur distingué chez AWS, a souligné que l'intégration via les API sans état, les API chat completions et responses classiquement utilisées, supprime totalement la friction de migration : les clients peuvent basculer leurs charges de travail existantes sur AWS sans réécrire une seule ligne de code. Les modèles OpenAI rejoignent désormais sur Bedrock les offres d'Anthropic, Meta, Mistral, Cohere et les propres modèles d'Amazon, sous un cadre unifié de sécurité, gouvernance et contrôle des coûts. Pour les équipes achats des grandes entreprises, ce qui était un écosystème multi-fournisseurs fragmenté se consolide en un seul point d'accès. AWS positionne ainsi Bedrock comme l'infrastructure de référence pour l'ère des agents logiciels autonomes. Le chemin vers cette alliance n'a pas été linéaire. L'accord de 50 milliards de dollars entre Amazon et OpenAI, annoncé en février 2026, avait créé une tension juridique avec Microsoft, qui revendiquait une exclusivité sur les API stateless d'OpenAI via Azure. Le Financial Times avait même rapporté que Microsoft envisageait des poursuites judiciaires. Le nouvel accord signé lundi a remplacé cette exclusivité à durée indéterminée par une licence non exclusive courant jusqu'en 2032, débloquant ainsi la voie pour AWS. Ce repositionnement marque une rupture structurelle dans les guerres du cloud : la course à l'exclusivité des modèles IA laisse place à une compétition sur l'infrastructure, l'outillage et l'expérience développeur. OpenAI, désormais libre de distribuer ses modèles partout, joue la carte de la ubiquité, tandis qu'AWS et Microsoft s'affrontent sur leur capacité à être la meilleure plateforme pour les déployer à l'échelle.

UELa consolidation du cloud IA entre AWS et OpenAI renforce la domination américaine sur l'infrastructure IA, réduisant l'espace stratégique pour des acteurs européens comme Mistral, déjà présent sur Bedrock mais en position minoritaire face à des plateformes unifiées.

BusinessOpinion
1 source
Entre OpenAI et Microsoft la rupture se précise : ChatGPT peut aller se vendre ailleurs
23Frandroid 

Entre OpenAI et Microsoft la rupture se précise : ChatGPT peut aller se vendre ailleurs

OpenAI et Microsoft ont revu en profondeur les termes de leur partenariat historique, conclu en 2019 et renforcé par des investissements cumulés de Microsoft dépassant les 13 milliards de dollars. Selon les nouvelles modalités de l'accord, OpenAI n'est plus tenu de distribuer exclusivement ses modèles et services via Azure, le cloud de Microsoft. La startup peut désormais nouer des accords commerciaux avec d'autres fournisseurs d'infrastructure, tout en maintenant une relation privilégiée avec Redmond, qui conserve un accès prioritaire aux technologies d'OpenAI. Ce changement redistribue les cartes dans la compétition pour l'infrastructure IA. Google Cloud, Oracle ou encore Amazon Web Services peuvent désormais accueillir les API d'OpenAI, ce qui ouvre à la startup un marché bien plus large pour monétiser ses modèles. Pour les entreprises clientes, cela signifie davantage de flexibilité : elles pourront intégrer GPT-4o ou d'autres modèles sans passer obligatoirement par Azure. Microsoft, de son côté, perd un avantage concurrentiel majeur qui lui avait permis de dominer le segment entreprise de l'IA depuis 2023. Ce rééquilibrage s'inscrit dans la transformation profonde qu'OpenAI traverse depuis fin 2024 : la startup accélère sa conversion en société à but lucratif classique et prépare une potentielle introduction en bourse, estimant sa valeur autour de 300 milliards de dollars. Prendre ses distances avec un partenaire unique devient une nécessité stratégique pour attirer de nouveaux investisseurs et démontrer son autonomie commerciale. Microsoft reste actionnaire et partenaire de référence, mais l'ère de l'exclusivité de fait semble bel et bien révolue.

UELes entreprises européennes utilisant les API OpenAI via Azure pourront désormais choisir d'autres fournisseurs cloud, réduisant leur dépendance à un fournisseur unique et potentiellement renégociant leurs contrats d'infrastructure IA.

BusinessOpinion
1 source
Fin de l’exclusivité, revenus plafonnés : les coulisses du nouveau deal Microsoft et OpenAI
24Le Big Data 

Fin de l’exclusivité, revenus plafonnés : les coulisses du nouveau deal Microsoft et OpenAI

Le 27 avril 2026, Microsoft et OpenAI ont officialisé une refonte en profondeur de leur partenariat stratégique, noué en 2019. Les deux entreprises ont annoncé la fin de l'exclusivité stricte qui liait jusqu'ici leurs relations commerciales, l'introduction d'un plafond sur les flux financiers mutuels, et une ouverture explicite au multi-cloud. Concrètement, Microsoft conserve son statut de partenaire cloud prioritaire jusqu'en 2032, ce qui signifie que les produits OpenAI continueront d'être lancés en premier sur Azure. Mais OpenAI peut désormais distribuer ses solutions sur d'autres infrastructures cloud, notamment si certaines fonctionnalités ne sont pas supportées par Microsoft. Côté propriété intellectuelle, la licence accordée à Microsoft sur les modèles OpenAI reste valable jusqu'en 2032, mais devient non exclusive. Sur le plan financier, Microsoft cesse de verser sa part de revenus à OpenAI, tandis que les flux inverses sont maintenus jusqu'en 2030 avec un plafond global. Microsoft demeure actionnaire clé d'OpenAI, et les deux partenaires poursuivront des projets communs, dont l'expansion de centres de données à l'échelle du gigawatt et le développement de semi-conducteurs dédiés à l'IA. Cet accord redistribue les cartes dans l'économie de l'IA générative en entreprise. Pour OpenAI, la liberté de déployer sur d'autres clouds est un gain commercial majeur : l'entreprise peut désormais répondre aux besoins clients sur AWS, Google Cloud ou Oracle sans dépendre du bon vouloir de Microsoft. Pour les entreprises utilisatrices, cela signifie davantage de choix d'infrastructure sans renoncer aux modèles d'OpenAI. Pour Microsoft, l'assouplissement est un pari calculé : Azure perd son monopole de fait sur les modèles GPT, mais le plafond de revenus et le maintien d'un accès privilégié limitent les risques financiers et technologiques. La logique de revenus bornés introduit surtout une prévisibilité que les deux groupes jugent préférable à une dépendance mutuelle de plus en plus contraignante dans un marché en accélération. Depuis les premiers investissements de Microsoft en 2019, puis le passage à plusieurs milliards de dollars injectés au fil des années, ce partenariat a structuré la montée en puissance de l'IA générative dans le monde professionnel, faisant d'Azure la porte d'entrée quasi obligatoire pour les entreprises voulant exploiter GPT-4 ou les modèles successeurs. Mais l'émergence de rivaux crédibles, Anthropic chez Amazon, Gemini chez Google, ainsi que la multiplication des cas d'usage et des clients souhaitant éviter un fournisseur unique, rendaient l'architecture exclusive de moins en moins tenable. Sam Altman a confirmé la nouvelle sur X dès le 27 avril, soulignant qu'OpenAI reste engagé à fournir modèles et produits à Microsoft jusqu'en 2032. La prochaine étape à surveiller est la conversion d'OpenAI en société à but lucratif classique, un processus en cours qui renforcera encore l'autonomie stratégique de l'entreprise vis-à-vis de ses partenaires historiques.

UELes entreprises européennes utilisant OpenAI gagnent en flexibilité d'infrastructure cloud, pouvant désormais déployer les modèles OpenAI sur AWS, Google Cloud ou Oracle sans dépendre exclusivement d'Azure.

💬 L'exclusivité, c'était une coquille qui craquait de partout. OpenAI peut maintenant déployer sur AWS ou GCP sans demander la permission à Microsoft, et pour les entreprises qui voulaient éviter de tout concentrer sur Azure, c'est un soulagement réel. Reste à voir si le "partenaire prioritaire jusqu'en 2032" c'est du cosmétique ou si Azure garde vraiment la main.

BusinessOpinion
1 source
Microsoft et OpenAI mettent fin à l'exclusivité de leur accord, ouvrant AWS et Google Cloud à OpenAI
25VentureBeat AI 

Microsoft et OpenAI mettent fin à l'exclusivité de leur accord, ouvrant AWS et Google Cloud à OpenAI

Microsoft et OpenAI ont annoncé lundi une refonte majeure de leur partenariat, mettant fin à l'exclusivité commerciale qui liait les deux entreprises depuis 2019. Selon les nouvelles modalités, OpenAI peut désormais distribuer ses produits sur n'importe quel fournisseur cloud, y compris Amazon Web Services et Google Cloud, une rupture avec l'accord initial qui réservait exclusivement à Azure l'hébergement de l'API d'OpenAI. Microsoft cesse de percevoir une part de revenus sur les accès aux modèles d'OpenAI via Azure, tandis qu'OpenAI continuera de reverser 20 % de ses recettes à Microsoft jusqu'en 2030, avec un plafond global désormais fixé. Microsoft conserve une licence sur la propriété intellectuelle d'OpenAI jusqu'en 2032, mais celle-ci est explicitement non exclusive. Les deux entreprises ont présenté cet accord dans des billets de blog publiés simultanément lundi. Cette restructuration ouvre la voie à OpenAI pour séduire les grandes entreprises qui exigent une flexibilité multi-cloud. Ces clients, le segment à la croissance la plus rapide d'OpenAI, refusaient de dépendre d'un seul fournisseur d'infrastructure. En permettant à OpenAI de vendre directement sur AWS et Google Cloud, l'accord lève un frein commercial majeur à un moment où la concurrence entre fournisseurs de modèles s'intensifie. Pour Microsoft, la fin de la part de revenus sur Azure représente un manque à gagner potentiel, mais l'entreprise conserve un accès privilégié et une licence sur la technologie d'OpenAI jusqu'en 2032. Pour l'industrie dans son ensemble, ce virage signale que même les alliances technologiques les plus exclusives cèdent sous la pression des réalités commerciales. Le partenariat originel remontait à 2019, quand Microsoft avait investi 1 milliard de dollars dans OpenAI, avant de porter ses engagements cumulés à plus de 13 milliards. En échange, Microsoft obtenait un accès commercial exclusif aux modèles d'OpenAI et à sa propriété intellectuelle. L'accord contenait même une clause philosophique singulière : l'exclusivité de Microsoft devait durer jusqu'à ce qu'OpenAI atteigne l'intelligence artificielle générale, dont la définition était laissée à la discrétion du conseil d'administration d'OpenAI. Ce modèle fonctionnait quand OpenAI n'était qu'un laboratoire de recherche, mais l'explosion de ChatGPT fin 2022 et la montée en flèche des revenus vers plusieurs milliards de dollars annuels ont rendu la contrainte insoutenable. La directrice des revenus d'OpenAI, Denise Dresser, avait récemment reconnu en interne que le partenariat "limitait la capacité de l'entreprise à rejoindre les clients là où ils se trouvent". Après des mois de tensions en coulisses, de contradictions publiques et de menaces de litiges, les deux entreprises ont choisi de transformer leur alliance exclusive en une relation commerciale stratégique mais nettement plus souple.

UELes entreprises européennes utilisant OpenAI gagnent en flexibilité multi-cloud, pouvant désormais déployer les modèles sur AWS et Google Cloud sans dépendance exclusive à Azure.

BusinessOpinion
1 source
Fin de l'exclusivité : Microsoft autorise OpenAI à recourir à d'autres fournisseurs cloud
26Ars Technica AI 

Fin de l'exclusivité : Microsoft autorise OpenAI à recourir à d'autres fournisseurs cloud

Microsoft et OpenAI ont annoncé conjointement une révision majeure de leur accord de partenariat, mettant fin à l'exclusivité qui liait les deux entreprises depuis 2019. Selon les termes du nouvel accord, OpenAI pourra désormais proposer l'ensemble de ses produits et modèles à des clients utilisant n'importe quel fournisseur cloud, et non plus exclusivement Microsoft Azure. Microsoft conserve néanmoins une licence sur la propriété intellectuelle et les modèles d'OpenAI jusqu'en 2032, et Azure demeure le "partenaire cloud principal" de l'entreprise pendant cette période. Le partage de revenus de 20 % versé par OpenAI à Microsoft est maintenu, mais il sera désormais plafonné à un montant non divulgué et uniquement garanti jusqu'en 2030. Ce changement ouvre une brèche considérable dans l'un des accords les plus structurants de l'industrie de l'intelligence artificielle. OpenAI pourra désormais nouer des partenariats avec des concurrents d'Azure comme Amazon Web Services ou Google Cloud Platform, intensifiant la compétition entre les géants du cloud pour héberger les modèles les plus puissants du marché. Pour les entreprises clientes d'OpenAI, cela signifie potentiellement plus de flexibilité dans le choix de leur infrastructure. Côté Microsoft, l'accord reste avantageux sur le plan de la licence, mais le groupe cède une position d'exclusivité qu'il détenait depuis six ans. Le partenariat originel avait débuté en 2019 avec un investissement initial de Microsoft d'un milliard de dollars, suivi d'engagements supplémentaires estimés à plusieurs milliards. L'un des points les plus controversés de l'accord initial était la "clause AGI" : elle prévoyait la fin de l'exclusivité si OpenAI venait à atteindre le seuil de l'intelligence artificielle générale, un critère notoirement difficile à définir. La révision annoncée rend désormais le partage de revenus "indépendant des progrès technologiques d'OpenAI", supprimant de fait cette clause ambiguë. Cette évolution intervient alors qu'OpenAI cherche à s'affirmer comme une entreprise pleinement indépendante, dans un contexte où les débats autour de sa gouvernance et de son statut à but non lucratif continuent d'agiter la Silicon Valley.

UELes entreprises européennes clientes d'OpenAI pourront désormais choisir librement leur fournisseur cloud (AWS, GCP) au lieu d'être contraintes à Azure, offrant plus de flexibilité stratégique et potentiellement de meilleures conditions tarifaires.

BusinessOpinion
1 source
Microsoft et OpenAI mettent fin à leur accord exclusif et s'ouvrent aux clouds concurrents
27Interesting Engineering 

Microsoft et OpenAI mettent fin à leur accord exclusif et s'ouvrent aux clouds concurrents

Microsoft et OpenAI ont officiellement mis fin à leur relation exclusive le 27 avril 2026, restructurant en profondeur l'accord qui liait les deux entreprises depuis plusieurs années. Selon les termes révisés, OpenAI pourra désormais proposer ses produits et services sur l'ensemble des plateformes cloud, y compris AWS d'Amazon et Google Cloud d'Alphabet, alors qu'Azure de Microsoft était jusqu'ici le seul partenaire autorisé. Microsoft conserve son statut de partenaire cloud principal et bénéficie d'une licence non exclusive sur les modèles et produits d'OpenAI jusqu'en 2032. Sur le plan financier, Microsoft cesse de percevoir une part des revenus générés via Azure, tandis qu'OpenAI continuera de lui verser une commission jusqu'en 2030, mais plafonnée et désormais découplée des jalons technologiques comme l'intelligence artificielle générale, qui conditionnaient auparavant les versements. Ce changement ouvre concrètement le marché entreprise à OpenAI d'une façon qui n'était pas possible jusqu'ici. Gil Luria, analyste chez D.A. Davidson & Co., l'a formulé clairement dans les colonnes de Reuters : les clients AWS et Google Cloud étaient freinés dans leur adoption des outils OpenAI précisément à cause de l'exclusivité, et ils vont désormais pouvoir envisager OpenAI aux côtés d'Anthropic. Pour les grandes organisations qui opèrent en dehors de l'écosystème Microsoft, c'est une levée de verrou majeure. Les analystes de Barclays y voient un bénéfice mutuel : Microsoft réduit sa charge d'infrastructure, tandis qu'OpenAI accélère son déploiement à grande échelle sans dépendre d'un seul fournisseur. Cette évolution s'inscrit dans un contexte de maturité du marché de l'IA d'entreprise, mais aussi de pression réglementaire croissante aux États-Unis, au Royaume-Uni et en Europe, où l'exclusivité entre les deux géants suscitait des inquiétudes sur la concurrence dans le cloud. De son côté, Microsoft diversifie déjà sa stratégie IA en développant ses propres modèles et en intégrant des alternatives comme ceux d'Anthropic dans Microsoft 365 Copilot. OpenAI, pour sa part, avait anticipé ce tournant en sécurisant d'autres partenariats cloud pour augmenter sa capacité de calcul. Les deux entreprises ont annoncé qu'elles poursuivront leur collaboration sur l'expansion des centres de données, le co-développement de puces avancées et la cybersécurité pilotée par l'IA. Le partenariat n'est plus exclusif, mais il reste structurant pour l'avenir de l'IA en entreprise.

UELes entreprises européennes hébergées sur AWS ou Google Cloud peuvent désormais adopter les outils OpenAI sans migrer vers Azure, ce qui répond aux préoccupations des régulateurs européens sur la concurrence dans le marché cloud IA.

💬 C'était écrit, et franchement j'attendais ça. L'exclusivité Azure freinait des pans entiers du marché enterprise (les boîtes sur AWS ou GCP ne voulaient pas migrer juste pour accéder aux outils OpenAI), sans compter les régulateurs européens qui commençaient à montrer les dents. OpenAI récupère sa liberté de distribution, Microsoft conserve sa licence et sa commission jusqu'en 2032, tout le monde rentre à la maison content, sur le papier du moins.

BusinessOpinion
1 source
Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA
28Le Big Data 

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA

Google a présenté le 22 avril 2026, lors de Google Cloud Next 2026, Gemini Enterprise : une plateforme unifiée conçue pour orchestrer des flottes d'agents IA à l'échelle de l'entreprise. La nouveauté fusionne l'application Gemini Enterprise pour les utilisateurs finaux et la nouvelle Gemini Enterprise Agent Platform pour les développeurs, absorbant au passage Vertex AI qui disparaît en tant que plateforme indépendante. Plus de 200 modèles sont accessibles via Model Garden, dont les dernières générations Gemini mais aussi des modèles tiers d'Anthropic et autres. La marketplace intégrée permet de connecter des agents issus de partenaires comme Oracle, ServiceNow, Adobe, Salesforce ou Workday. Du côté technique, la plateforme introduit Agent Studio pour le développement low-code, un SDK basé sur des graphes pour les systèmes multi-agents, et Agent Runtime pour des agents capables de fonctionner en continu pendant des heures, voire des jours. Des outils d'optimisation complètent l'ensemble : Agent Simulation, Evaluation et Observability. Pour les directions informatiques, la gouvernance est au coeur du dispositif. Chaque agent se voit attribuer une identité cryptographique via Agent Identity, tandis qu'un registre central valide les outils et agents autorisés, et qu'Agent Gateway applique les politiques de sécurité à l'échelle de l'organisation. La couche de protection intègre Model Armor pour contrer les injections malveillantes et les fuites de données, appuyée par Security Command Center pour la détection des vulnérabilités. Du côté des équipes métier, Agent Designer permet de créer et déployer des agents sans écrire de code, depuis une interface unique avec boîte de réception centralisée, espaces projets à mémoire partagée et outil collaboratif Canvas pour produire des documents exportables vers Microsoft Office. Un agent Data Insights natif analyse données structurées et non structurées pour générer visualisations et rapports, tandis que Deep Research synthétise sources web et données internes. Ce lancement s'inscrit dans une course intense entre les grands acteurs du cloud pour capter les budgets IA des entreprises. Microsoft, avec Copilot Studio et Azure AI Foundry, Amazon avec Bedrock Agents, et Salesforce avec Agentforce occupent le même terrain. Google répond en cassant la fragmentation de son offre précédente : Vertex AI, Duet AI, Gemini for Workspace coexistaient sans cohérence claire pour les acheteurs. En absorbant tout dans une plateforme unique, Google vise à simplifier les cycles de vente et à verrouiller les grandes entreprises dans son écosystème. La compatibilité revendiquée avec Microsoft 365 et Google Workspace trahit la volonté de ne pas imposer une migration brutale, mais de s'intégrer aux environnements existants. L'enjeu des prochains mois sera la disponibilité réelle de ces fonctionnalités et leur tenue à l'échelle, deux points sur lesquels les annonces de Cloud Next ont historically précédé des déploiements progressifs.

UELes entreprises européennes utilisant Google Cloud devront évaluer la migration vers cette plateforme unifiée, dont les mécanismes de gouvernance (identité cryptographique des agents, registre central, audit de sécurité) pourraient faciliter la mise en conformité avec l'AI Act.

OutilsOutil
1 source
Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant
29VentureBeat AI 

Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant

Cirrascale Cloud Services a annoncé lors du Google Cloud Next 2026 à Las Vegas un accord élargi avec Google Cloud pour déployer le modèle Gemini en mode entièrement déconnecté, sur des serveurs physiques isolés d'internet. Cirrascale devient ainsi le premier fournisseur de cloud spécialisé à proposer le modèle phare de Google sous forme d'appliance privée, installée soit dans les centres de données de Cirrascale, soit directement dans les locaux du client. Le système repose sur un serveur certifié Google, fabriqué par Dell, équipé de huit GPU Nvidia et protégé par des mécanismes de calcul confidentiel. Une préversion est disponible immédiatement, avec une disponibilité générale attendue en juin ou juillet 2026. Dave Driggers, PDG de Cirrascale, a insisté sur un point clé : il s'agit du modèle Gemini complet, sans aucune restriction ni version allégée, déployé dans un environnement où les données d'entrée comme de sortie restent entièrement sous le contrôle du client. Fait notable sur le plan technique, les poids du modèle résident uniquement en mémoire volatile : dès que l'alimentation est coupée, le modèle disparaît sans laisser de trace persistante. Cette annonce répond à un problème structurel qui bloque depuis des années les secteurs régulés comme la finance, la santé, la défense et les administrations publiques. Ces organisations devaient jusqu'ici choisir entre accéder aux modèles les plus puissants via des API cloud publiques, au risque d'exposer leurs données sensibles à l'infrastructure d'un tiers, ou se contenter de modèles open source moins performants hébergés en interne. Le déploiement Cirrascale entend supprimer ce compromis. Driggers décrit l'escalade du problème de confiance : après les inquiétudes sur les données propriétaires confiées aux hyperscalers, les entreprises ont pris conscience que les prompts et les réponses générées étaient également récupérés par ces mêmes plateformes pour alimenter leurs propres systèmes, ce qui a rendu la demande de souveraineté totale incontournable. Cette évolution s'inscrit dans un mouvement plus large de migration des modèles d'IA frontier hors des centres de données des grands hyperscalers, vers les infrastructures propres des clients, ce qui représente une rupture avec la logique cloud dominante de la dernière décennie. Driggers distingue explicitement cette offre des déploiements on-premises proposés par Microsoft Azure avec les modèles OpenAI ou par AWS Outposts : dans ces cas, les modèles restent liés à l'infrastructure de leurs éditeurs. Ici, Google ne possède pas le matériel, et son modèle fonctionne en dehors de tout réseau Google. Pour le géant de Mountain View, accepter ce niveau de délégation sur son modèle le plus avancé traduit une stratégie commerciale claire : conquérir les marchés réglementés qui lui étaient jusqu'ici fermés, quitte à renoncer au contrôle direct de l'inférence.

UECe mode de déploiement air-gap répond directement aux exigences du RGPD et de l'AI Act en matière de souveraineté des données, ouvrant potentiellement Gemini aux administrations publiques, établissements de santé et institutions financières européennes soumis à des contraintes strictes de localisation et d'isolation des données.

💬 Le truc des poids uniquement en mémoire volatile, c'est la partie que je trouve la plus maligne. Parce que le blocage dans les secteurs régulés c'était pas juste "mes données sortent du réseau", c'était aussi "quelqu'un peut extraire ou copier le modèle", et là, coupe l'alimentation, ça disparaît. Google accepte de perdre le contrôle de l'inférence de son meilleur modèle pour aller chercher des marchés qui lui étaient fermés depuis des années. Ça, c'est un vrai mouvement.

InfrastructureOpinion
1 source
30The Decoder 

Amazon investit 33 milliards dans Anthropic, qui s'engage à dépenser 100 milliards sur AWS

Amazon a annoncé un investissement supplémentaire pouvant atteindre 25 milliards de dollars dans Anthropic, portant l'engagement total du géant du e-commerce à environ 33 milliards de dollars dans la startup d'intelligence artificielle. En contrepartie, Anthropic s'est engagée à dépenser plus de 100 milliards de dollars sur l'infrastructure cloud d'Amazon Web Services au cours des dix prochaines années. Cet accord massif vise notamment à répondre à la tension croissante sur les capacités de calcul dont Anthropic a besoin pour entraîner et déployer ses modèles Claude à grande échelle. L'impact de ce partenariat est considérable pour l'ensemble de l'industrie de l'IA. Pour Anthropic, l'accès garanti à une infrastructure AWS de cette ampleur lui permet de rivaliser avec OpenAI et Google DeepMind sans être freinée par des contraintes de capacité. Pour Amazon, l'accord consolide AWS comme fournisseur cloud de référence pour les acteurs de l'IA générative, un marché en pleine explosion où Microsoft Azure et Google Cloud se disputent chaque contrat stratégique. Ce deal illustre parfaitement la dynamique circulaire qui caractérise désormais le secteur : les grands fournisseurs cloud injectent des milliards dans des startups IA, qui recyclent immédiatement ces fonds en achats d'infrastructure chez ces mêmes investisseurs. Amazon avait déjà investi 4 milliards de dollars dans Anthropic en 2023, avant un second engagement de plusieurs milliards en 2024. Cette escalade des montants reflète la course aux ressources de calcul qui structure la compétition mondiale en intelligence artificielle, où la puissance de traitement est devenue l'actif stratégique le plus convoité.

UELe renforcement d'AWS comme infrastructure cloud dominante pour l'IA générative accentue la dépendance des entreprises européennes envers les hyperscalers américains, creusant l'écart avec les ambitions de souveraineté numérique portées par le Cloud de Confiance et les initiatives européennes.

31Le Big Data 

Pourquoi les infrastructures cloud dédiées à l’IA deviennent un enjeu stratégique en Europe ?

Le groupe SWI (Stoneweg Icona Group) a annoncé l'acquisition d'une participation majoritaire dans Polarise, une société allemande spécialisée dans les infrastructures cloud pour l'intelligence artificielle, valorisant cette dernière à 500 millions d'euros. En parallèle, SWI s'engage à injecter un milliard d'euros supplémentaires pour accélérer le développement de ce qui se veut le premier opérateur d'infrastructures numériques souveraines à l'échelle européenne. Polarise dispose déjà de 14 centres de données opérationnels à travers l'Europe, d'une capacité totale de 2,3 GW via sa plateforme AiOnX, et d'un partenariat privilégié avec Nvidia lui donnant accès direct aux GPU les plus puissants du marché. La société a également lancé la première "AI Factory" d'Allemagne en collaboration avec Deutsche Telekom, positionnant d'emblée ce rapprochement comme une initiative industrielle de premier plan. Max-Hervé George, fondateur et PDG de SWI Group, pilote cette stratégie d'intégration verticale, couvrant la chaîne complète du foncier aux logiciels cloud. L'enjeu est considérable : les entreprises et gouvernements européens cherchent à réduire leur dépendance aux hyperscalers américains, AWS, Azure, Google Cloud, pour les charges de travail les plus sensibles. L'acquisition permet à SWI de proposer un modèle "GPU-as-a-Service" permettant aux organisations de louer de la puissance de calcul GPU à la demande, sans investissement lourd en matériel, via une infrastructure localisée en Europe et soumise au droit européen. Pour les industries de pointe en Allemagne, en France ou en Norvège, cela représente un accès à des capacités de calcul haute performance sans compromis sur la souveraineté des données. Ce modèle favorise également une innovation plus rapide pour les startups et PME qui n'ont pas les moyens de construire leur propre infrastructure. Cette opération s'inscrit dans un mouvement plus large de structuration de la filière IA européenne face à la domination des géants américains et à la montée en puissance des acteurs chinois. L'Union européenne multiplie depuis plusieurs années les appels à bâtir une capacité numérique autonome, notamment à travers le règlement sur l'IA et les investissements du programme Horizon. La rareté des GPU Nvidia, dont Polarise est revendeur agréé, confère à cette alliance un avantage concurrentiel structurel dans un marché sous tension. Les prochaines étapes visent l'extension géographique vers l'Allemagne et la Norvège, deux pays disposant d'une énergie abondante et bon marché indispensable pour alimenter ces infrastructures énergivores. Si SWI tient ses engagements d'investissement, le groupe pourrait devenir un acteur de référence pour les contrats publics et les grandes entreprises cherchant une alternative crédible aux solutions extraeuropéennes.

UEL'acquisition crée un opérateur cloud souverain européen offrant aux entreprises et gouvernements de l'UE une alternative concrète aux hyperscalers américains pour leurs charges de travail sensibles, avec accès aux GPU Nvidia via une infrastructure soumise au droit européen.

InfrastructureOpinion
1 source
32AI News 

Commvault déploie une fonction 'Annuler' pour les charges de travail d'IA dans le cloud

Paragraphe 1 (Les faits): Le fournisseur de protection des données, Commvault, a déployé "AI Protect", une solution qui offre une fonctionnalité 'annuler' pour les agents d'IA dans les environnements cloud entreprises. Ces agents autonomes peuvent potentiellement supprimer des fichiers, lire des bases de données, lancer des clusters de serveurs et même modifier les politiques d'accès. AI Protect surveille ces actions au sein d'AWS, Microsoft Azure et Google Cloud. Les outils traditionnels de gouvernance reposent sur des règles statiques ; toute action est clairement attribuée à un utilisateur humain. Les agents d'IA, en revanche, montrent un comportement émergent. Ils combinent les autorisations approuvées de manière imprévue pour résoudre des problèmes complexes. Si un agent juge que la suppression complète d'une base de données de production optimise les coûts de stockage en nuage, il exécutera rapidement cette commande, bien plus vite qu'un ingénieur humain pourrait réagir. Paragraphe 2 (Pourquoi c'est important): L'introduction d'une telle fonctionnalité est cruciale car les agents d'IA peuvent effectuer des actions destructrices en millisecondes, bien plus rapidement que les équipes de sécurité opérationnelles humaines peuvent réagir. AI Protect force ces acteurs cachés à l'éclairage en identifiant et surveillant leurs activités spécifiques via des appels API et interactions de données, à travers les principaux fournisseurs cloud. La fonction de retour en arrière offre une sécurité essentielle : les administrateurs peuvent restaurer l'environnement à son état exact avant que le modèle n'initie la séquence destructrice si l'agent commet une erreur ou malinterprète une commande. Cependant, en raison de la nature très interconnectée et de l'état-état des infrastructures cloud, un simple restaure d'une table de base de données n'est pas suffisant ; tous les changements apportés par le machine doivent être précisément suivis, y compris modifications de règles de réseau, triggers de fonctions serveurless et ajustements des politiques de gestion des identités. Paragraphe 3 (Le contexte): Ce développement survient à mesure que les entreprises doivent faire face aux défis croissants posés par l'utilisation croissante des agents d'IA, souvent créés et déployés sans supervision par les développeurs. Les outils de gouvernance évoluent pour répondre à cette nouvelle réalité. Commvault joue un rôle clé en bridant l'architecture de sauvegarde traditionnelle avec la surveillance continue du cloud, en cartographiant ainsi le rayon d'impact des sessions des agents d'IA pour isoler les dommages et éviter les retours arrière indiscriminés pouvant effacer des transactions clients valides ou annuler des travaux légitimes effectués par des ingénieurs humains. À mesure que les machines continuent d'exécuter des tâches plus rapidement que les opérateurs humains peuvent les surveiller, l'accent est mis sur la mise en place de garde-fous pour permettre un revers instantané et précis des actions autonomes.

UECommvault offre une solution cruciale pour surveiller et contrôler les actions potentiellement destructrices des agents d'IA dans les environnements cloud, atténuant ainsi les risques de sécurité pour les entreprises européennes.

💬 Un bouton "annuler" pour les agents IA, c'est exactement le genre de truc qu'on aurait dû exiger avant de lâcher ces trucs en prod. Le vrai problème, c'est que dans un cloud bien emmêlé, rollback une table ne suffit pas : il faut tout retracer, les règles réseau, les fonctions serverless, les IAM policies modifiées dans la foulée. Commvault a visiblement compris ça, bon, reste à voir si leur cartographie tient en conditions réelles.

SécuritéActu
1 source
« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT
33Le Big Data 

« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT

Un homme a lancé un cocktail Molotov contre la résidence de Sam Altman, PDG d'OpenAI, située au 950 Lombard Street à San Francisco, dans le quartier de Russian Hill, une propriété estimée à 27 millions de dollars. L'attaque, survenue début avril 2026, s'inscrit dans le cadre d'un manifeste de 45 pages intitulé « La Dernière Résistance Humaine », diffusé sur X et 4chan, qui appelle au sabotage physique des centres de données et à la destruction des infrastructures d'intelligence artificielle générative. L'assaillant, radicalisé par les thèses néo-luddites, a été placé en garde à vue. Le manifeste identifie 12 sites critiques aux États-Unis, principalement en Californie et en Oregon, hébergeant des clusters de processeurs H100 de Nvidia, et réclame l'arrêt immédiat de l'entraînement de modèles comme GPT-5 ainsi que le démantèlement des infrastructures Microsoft Azure. Le FBI et le Department of Homeland Security classent désormais les extrémistes anti-technologie comme une menace prioritaire. Cet acte marque un tournant dans la perception des risques liés au développement de l'IA : pour la première fois, la violence physique ciblée contre des dirigeants tech s'organise autour d'une idéologie structurée et d'une liste de cibles précises. L'onde de choc a immédiatement atteint les investisseurs de Y Combinator et les dirigeants de Google DeepMind. OpenAI a multiplié son budget sécurité par cinq, déployant un blindage balistique de niveau NIJ III sur les vitres du domicile d'Altman et une garde rapprochée composée d'anciens Navy SEALs, pour un coût supérieur à 800 000 dollars par mois. Des algorithmes de surveillance des forums radicaux ont également été activés. La menace dépasse le cas individuel : elle interroge la capacité des entreprises d'IA à protéger leurs dirigeants et infrastructures dans un climat de défiance croissante. La rhétorique du manifeste est paradoxale : son auteur cite les propres avertissements de Sam Altman et du prix Nobel Geoffrey Hinton sur les risques existentiels de l'intelligence artificielle générale pour légitimer le recours à la violence. Ce retournement sémantique rappelle la trajectoire de Theodore Kaczynski, l'Unabomber, dont le manifeste fut publié par le New York Times en 1995 après une campagne d'attentats contre des universitaires et des compagnies aériennes. Là où les luddites du XIXe siècle s'en prenaient aux métiers à tisser pour protéger leurs emplois, et où Kaczynski visait la société industrielle en général, ce nouveau mouvement cible spécifiquement les architectes des grands modèles de langage et les GPU qui les font tourner. L'analyse de CrowdStrike confirme que le document circule dans des réseaux cryptés et pourrait inspirer des actes similaires, faisant basculer le débat sur les risques de l'IA du registre académique vers celui de la sécurité nationale.

UEL'émergence d'un mouvement néo-luddite violent aux États-Unis pourrait inspirer des actes similaires en Europe, contraignant les entreprises et infrastructures d'IA européennes à renforcer leur sécurité physique.

💬 On savait que la tension montait, mais là on a franchi un cap. Ce qui est glaçant, c'est pas l'acte en lui-même, c'est le manifeste : 45 pages structurées, une liste de 12 cibles précises, une idéologie qui recycle les propres mots d'Altman pour justifier la violence. C'est plus un dérangé isolé, c'est le début d'une doctrine.

SécuritéOpinion
1 source
OpenAI tacle Microsoft : l’alliance avec Amazon devient la nouvelle priorité stratégique
34Le Big Data 

OpenAI tacle Microsoft : l’alliance avec Amazon devient la nouvelle priorité stratégique

OpenAI vient de franchir une étape symbolique dans sa stratégie commerciale : selon une note interne de Denise Dresser, directrice des revenus de l'entreprise, le partenariat signé avec Amazon représente désormais un moteur de croissance prioritaire pour le segment enterprise. Ce partenariat, annoncé il y a moins de deux mois et adossé à un engagement financier d'Amazon de 50 milliards de dollars, s'appuie sur AWS Bedrock, la plateforme cloud qui permet aux entreprises d'accéder à plusieurs modèles d'IA dont ceux d'OpenAI. Dans la même note, Dresser reconnaît explicitement que l'alliance historique avec Microsoft, qui a investi plus de 13 milliards de dollars depuis 2019, « restreint » désormais la capacité d'OpenAI à répondre aux besoins du marché. Le segment enterprise représente déjà 40 % du chiffre d'affaires d'OpenAI, et la demande enregistrée depuis l'intégration via Bedrock est décrite comme « stupéfiante ». Ce pivotement stratégique a des conséquences directes pour les clients entreprises et pour l'ensemble de l'industrie cloud. En permettant l'accès à ses modèles via AWS plutôt qu'exclusivement via Azure, OpenAI s'aligne sur les infrastructures déjà en place chez la majorité de ses clients B2B, levant ainsi un frein concret à l'adoption. La flexibilité offerte par Bedrock, présentée comme une couche d'accès plus ouverte que l'écosystème Microsoft, répond à une demande réelle du marché. Pour OpenAI, l'enjeu est aussi défensif : Anthropic, avec son modèle Claude, a enregistré un chiffre d'affaires annualisé supérieur à 30 milliards de dollars et gagne rapidement du terrain dans les entreprises, au point d'avoir généré ce qu'on a appelé la « Claudemania » lors de la conférence HumanX à San Francisco. La relation entre OpenAI et Microsoft se dégrade donc progressivement depuis mi-2024, date à laquelle Microsoft a officiellement classé OpenAI parmi ses concurrents dans son rapport annuel, aux côtés d'Amazon, Google et Meta. Redmond développe en parallèle ses propres modèles d'IA et renforce Copilot, réduisant mécaniquement sa dépendance à son ancien partenaire exclusif. OpenAI, de son côté, diversifie déjà ses fournisseurs de calcul vers Oracle, Google et CoreWeave. Ce décroisement progressif dessine une nouvelle carte du pouvoir dans l'IA enterprise : des alliances moins exclusives, plus pragmatiques, dictées par la présence réelle des clients dans les écosystèmes cloud. La bataille pour le marché B2B de l'IA n'en est qu'à ses débuts, et chaque géant repositionne ses pièces en conséquence.

UELes entreprises européennes déjà hébergées sur AWS peuvent désormais accéder aux modèles OpenAI via Bedrock sans migration vers Azure, réduisant concrètement le frein à l'adoption de l'IA dans les environnements cloud existants.

💬 Microsoft a mis 13 milliards sur la table depuis 2019 et se retrouve aujourd'hui listé comme concurrent dans les rapports annuels d'OpenAI, c'est assez symptomatique de la vitesse à laquelle les alliances se déconstruisent dans ce secteur. Le fond du sujet, c'est que les clients enterprise sont déjà sur AWS, pas sur Azure, et OpenAI a visiblement décidé d'aller là où se trouvent les deals plutôt que de défendre une exclusivité qui lui coûte des contrats. La pression de Claude en arrière-plan accélère tout ça.

BusinessOpinion
1 source
35The Information AI 

Microsoft freine ses investissements dans l'IA et cherche maintenant à rattraper son retard

Microsoft se retrouve aujourd'hui en retard dans la course aux infrastructures d'intelligence artificielle, après une série de décisions qui lui ont coûté une avance considérable sur ses concurrents. Au début du boom de l'IA, l'équipe infrastructure de l'entreprise avait constitué un portefeuille de sites de data centers représentant 9 gigawatts de capacité électrique, l'équivalent de neuf réacteurs nucléaires, ce qui faisait l'envie du secteur. Mais fin 2024 et début 2025, face à des dépenses d'investissement en infrastructure qui menaçaient de dépasser les 80 milliards de dollars budgétés pour l'exercice fiscal, la directrice financière Amy Hood a mis le frein. L'équipe énergie de Microsoft a dû abandonner ou suspendre plusieurs projets de data centers en cours, aussi bien aux États-Unis qu'en Europe. En octobre dernier, Hood reconnaissait publiquement que le service cloud Azure manquait de capacité. "Je pensais que nous allions rattraper notre retard. Ce n'est pas le cas", déclarait-elle lors d'un appel aux investisseurs. Microsoft restera "limité en capacité" au moins jusqu'à la fin de son exercice fiscal en juin 2026. Les conséquences de ce retrait ont été immédiates et concrètes pour la position compétitive de Microsoft. Google, Oracle et d'autres acteurs ont profité du vide laissé pour avancer leurs propres projets et sécuriser des raccordements au réseau électrique que Microsoft avait abandonnés. Oracle a récupéré une part importante de la capacité disponible pour son data center en construction à Port Washington, dans le Wisconsin, destiné à accueillir les besoins d'OpenAI. Google a accéléré le développement de deux campus en Indiana pendant que Microsoft était en mode attente. Plusieurs membres de l'équipe énergie ont depuis quitté l'entreprise, dont le directeur énergie Bobby Hollis, dont le départ a été annoncé le 31 mars 2026. Pour combler l'écart, Microsoft a signé des accords avec des partenaires tiers, dont les acteurs spécialisés Nscale et Crusoe, ainsi qu'avec le géant énergétique Chevron et le fonds Engine No. 1, en misant sur une production électrique privée hors réseau alimentée au gaz naturel, notamment au Texas et en Virginie-Occidentale. Cette situation s'inscrit dans un contexte de tension structurelle sur le réseau électrique américain, où obtenir un raccordement peut prendre plusieurs années. Microsoft n'est pas en mesure de retrouver sa place dans les files d'attente des opérateurs réseau qu'elle a libérées. Certains observateurs, dont des responsables d'infrastructure familiers des projets, estiment que la discipline budgétaire imposée par Hood pourrait néanmoins s'avérer judicieuse à long terme : en transférant une partie du risque de construction à ses partenaires, Microsoft préserve sa flexibilité pour acquérir des sites à des conditions plus favorables dans un marché qui commence à se rationaliser. Alistair Speirs, directeur général de l'infrastructure Azure, a défendu une "approche fondée sur la flexibilité et les options", en fonction des signaux de demande à court et long terme.

UEMicrosoft a suspendu plusieurs projets de data centers en Europe, réduisant la capacité cloud Azure disponible pour les entreprises européennes et retardant l'accès à l'infrastructure IA dans la région.

💬 9 gigawatts en portefeuille, et ils ont lâché les raccordements réseau au pire moment. Dans un marché où se connecter au réseau électrique prend parfois des années, tu ne reviens pas dans la file une fois que t'en es sorti, peu importe le budget que tu remets sur la table ensuite. Google et Oracle n'ont pas eu besoin de se battre, ils ont juste ramassé ce que Microsoft avait laissé.

InfrastructureActu
1 source
Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence
36Le Big Data 

Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence

Mistral AI, la licorne française valorisée 11,7 milliards d'euros, a publié un document détaillant 22 mesures d'urgence pour permettre à l'Europe de ne pas se laisser distancer par les États-Unis et la Chine dans la course à l'intelligence artificielle. Parmi les propositions phares figure la création d'une "AI blue card", un titre de séjour simplifié inspiré de la carte bleue européenne, destiné à faciliter l'installation de chercheurs et développeurs étrangers sur le continent. L'entreprise appelle également à instaurer une préférence européenne dans les marchés publics, à introduire des incitations fiscales pour l'adoption d'infrastructures locales, et à centraliser les oeuvres du domaine public afin d'alimenter l'entraînement des modèles d'IA sans dépendre des plateformes étrangères. Pour donner corps à sa vision, Mistral AI a levé 830 millions de dollars de dette, destinés notamment à la construction d'un centre de données en France, avec un objectif de plus d'un milliard d'euros de chiffre d'affaires d'ici 2026. Ces propositions s'attaquent à un déséquilibre structurel documenté : sur 1 400 milliards de dollars investis dans le numérique à l'échelle mondiale, 80 % sont captés par les États-Unis. L'Europe dispose des talents et d'une capacité de financement, mais peine à organiser un marché cohérent qui permette à ses acteurs de rivaliser. Si les mesures proposées par Mistral étaient adoptées, elles changeraient concrètement les règles du jeu pour les entreprises et administrations européennes, qui seraient incitées à privilégier des solutions locales plutôt que de s'appuyer sur AWS, Azure ou Google Cloud. Pour les chercheurs étrangers, la "AI blue card" représenterait un signal fort que l'Europe entend sérieusement concurrencer la Silicon Valley en matière d'attractivité. Ces propositions s'inscrivent dans un contexte de prise de conscience accélérée sur la souveraineté technologique en Europe. OpenAI elle-même a publié récemment 13 pages de recommandations sur l'encadrement de l'automatisation, signe que les grands acteurs cherchent à peser sur les débats réglementaires avant que les gouvernements ne tranchent. Mistral, fondée en 2023 par d'anciens chercheurs de DeepMind et Meta, s'est rapidement imposée comme le champion européen de l'IA générative, avec des modèles open source compétitifs face aux offres américaines. En publiant ce plan en 22 points, la startup sort d'une posture purement technique pour entrer dans le débat politique et industriel, à un moment où la Commission européenne et les États membres cherchent encore leur doctrine face à la montée en puissance des grands modèles. Les prochains mois seront décisifs : si ces mesures trouvent un écho à Bruxelles ou à Paris, elles pourraient redéfinir les conditions dans lesquelles se développe l'IA en Europe.

UEMistral AI, licorne française, propose 22 mesures concrètes, préférence européenne dans les marchés publics, 'AI blue card' pour les talents étrangers, incitations fiscales pour l'infrastructure locale, qui pourraient redéfinir les règles du jeu pour les entreprises et administrations françaises et européennes.

RégulationReglementation
1 source
Microsoft publie un toolkit open source pour sécuriser les agents IA en production
37AI News 

Microsoft publie un toolkit open source pour sécuriser les agents IA en production

Microsoft a publié un toolkit open-source destiné à sécuriser les agents d'intelligence artificielle en temps réel au sein des environnements d'entreprise. Baptisé runtime security toolkit, cet outil s'intercale entre le modèle de langage et le réseau d'entreprise pour surveiller, évaluer et bloquer les actions des agents autonomes au moment précis où ils tentent de les exécuter. Concrètement, lorsqu'un agent IA déclenche un appel vers un outil externe, une base de données, un pipeline CI/CD ou un dépôt cloud, le toolkit intercepte la requête, la compare à un ensemble de règles de gouvernance centralisées, et bloque l'action si elle enfreint la politique définie. Un agent autorisé uniquement à consulter un inventaire qui tenterait de passer une commande d'achat se verrait immédiatement arrêté, et l'événement serait journalisé pour révision humaine. L'enjeu est considérable pour les équipes de sécurité et les développeurs. Les systèmes d'IA d'entreprise ne se contentent plus de répondre à des questions : ils exécutent du code, envoient des e-mails, modifient des fichiers et interagissent avec des API critiques sans intervention humaine directe. Les méthodes traditionnelles, analyse statique du code, scan de vulnérabilités avant déploiement, sont structurellement inadaptées aux modèles de langage non-déterministes. Une seule attaque par injection de prompt ou une hallucination mal orientée peut suffire à écraser une base de données ou exfiltrer des données clients. Le toolkit de Microsoft découple la politique de sécurité de la logique applicative : les développeurs n'ont plus à hardcoder des règles de sécurité dans chaque prompt, et les équipes sécurité disposent d'une piste d'audit vérifiable pour chaque décision autonome du modèle. Le choix de publier ce toolkit sous licence open-source n'est pas anodin. Les développeurs construisent aujourd'hui des workflows autonomes en combinant des bibliothèques open-source, des frameworks variés et des modèles tiers, Anthropic, Meta, Mistral ou d'autres. Un outil propriétaire lié à l'écosystème Microsoft aurait probablement été contourné au profit de solutions non vérifiées, sous pression des délais. En ouvrant le code, Microsoft permet à n'importe quelle organisation, qu'elle tourne sur des modèles locaux, sur Azure ou sur des architectures hybrides, d'intégrer ces contrôles de gouvernance sans dépendance fournisseur. L'ouverture invite aussi la communauté cybersécurité à contribuer et à empiler des outils commerciaux, tableaux de bord, intégrations de réponse aux incidents, par-dessus cette fondation commune, accélérant la maturité de tout l'écosystème. À mesure que les agents autonomes s'imposent dans les entreprises, ce type de couche de sécurité d'infrastructure pourrait devenir un standard incontournable.

UELes entreprises européennes déployant des agents IA peuvent adopter cet outil open-source pour répondre aux exigences de gouvernance et de traçabilité imposées par l'AI Act.

SécuritéOpinion
1 source
Microsoft lance 3 nouveaux modèles d'IA pour rivaliser avec OpenAI et Google
38VentureBeat AI 

Microsoft lance 3 nouveaux modèles d'IA pour rivaliser avec OpenAI et Google

Microsoft a lancé mercredi trois nouveaux modèles d'intelligence artificielle développés entièrement en interne : MAI-Transcribe-1, un système de transcription vocale, MAI-Voice-1, un moteur de synthèse vocale, et MAI-Image-2, un générateur d'images amélioré. Disponibles immédiatement via Microsoft Foundry et un nouveau MAI Playground, ces modèles positionnent le géant du logiciel — valorisé 3 000 milliards de dollars — en concurrent direct d'OpenAI, Google et ElevenLabs sur le terrain du développement de modèles fondamentaux, et plus seulement sur leur distribution. MAI-Transcribe-1 affiche un taux d'erreur moyen de 3,8 % sur le benchmark FLEURS dans les 25 langues les plus utilisées dans les produits Microsoft, surpassant Whisper-large-v3 d'OpenAI sur l'ensemble de ces langues, et Gemini Flash de Google sur 22 d'entre elles. Le modèle traite les fichiers MP3, WAV et FLAC jusqu'à 200 Mo, avec une vitesse de transcription 2,5 fois supérieure à l'offre Azure actuelle, tout en consommant deux fois moins de GPU que la concurrence selon Microsoft. MAI-Voice-1 génère 60 secondes d'audio naturel en une seconde, à 22 dollars par million de caractères. MAI-Image-2, classé dans le top 3 sur Arena.ai, est déployé dans Bing et PowerPoint à 33 dollars par million de tokens image, et compte déjà WPP, le plus grand groupe publicitaire mondial, parmi ses premiers clients entreprise. Ces trois modèles constituent la première réponse concrète de Microsoft à une pression considérable des investisseurs : l'action vient de clôturer son pire trimestre depuis la crise financière de 2008, alors que des centaines de milliards de dépenses en infrastructure IA tardent à se traduire en revenus. En développant ses propres modèles, Microsoft réduit son coût de revient en remplaçant progressivement les modèles tiers — à commencer par une intégration de MAI-Transcribe-1 dans Copilot Voice et Microsoft Teams. La stratégie d'« autosuffisance en IA », formulée par Mustafa Suleyman, patron de Microsoft AI, vise à transformer l'entreprise d'un distributeur de technologie externe en producteur de modèles de pointe. Ce pivot n'aurait pas été possible sans un changement contractuel majeur survenu en octobre 2025. Le contrat originel de 2019 entre Microsoft et OpenAI interdisait explicitement à Microsoft de développer ses propres modèles d'intelligence artificielle générale en échange d'une licence sur les modèles d'OpenAI. La renégociation de cet accord a libéré Microsoft, qui a aussitôt constitué une équipe dédiée à la superintelligence — celle-là même qui vient de produire ces premiers résultats en six mois seulement. L'enjeu dépasse le seul marché de la transcription ou des images : Microsoft cherche à ne plus dépendre d'un partenaire unique pour alimenter ses produits phares, à l'heure où la compétition entre labs frontier s'intensifie et où chaque point de marge compte face à des coûts d'infrastructure colossaux.

UELes développeurs et entreprises européens peuvent accéder immédiatement à ces modèles via Microsoft Foundry, avec un impact potentiel sur les choix de fournisseurs pour la transcription vocale, la synthèse et la génération d'images dans les produits Microsoft déjà largement déployés en Europe.

💬 Ce qui me frappe dans cette news, c'est pas les benchmarks, c'est la clause contractuelle de 2019 qu'on découvre en passant : pendant six ans, Microsoft était littéralement interdit de construire ses propres modèles. Six ans à jouer le revendeur d'OpenAI. La renégociation d'octobre dernier change tout, et six mois plus tard ils sortent trois modèles qui tiennent la route. Reste à voir si c'est le début d'une vraie indépendance ou juste un argument de plus pour les actionnaires.

La levée de fonds d'OpenAI ; La (désastreuse) promotion des IPO de 2021
39The Information AI 

La levée de fonds d'OpenAI ; La (désastreuse) promotion des IPO de 2021

OpenAI a officialisé une levée de fonds massive, annonçant des engagements totaux atteignant 122 milliards de dollars. Parmi les contributeurs principaux, Amazon s'est engagé à hauteur de 50 milliards de dollars, dont seulement 15 milliards sont versés immédiatement — le reste étant conditionné à plusieurs facteurs, notamment l'entrée en Bourse d'OpenAI. SoftBank participera pour 30 milliards de dollars, répartis en trois versements échelonnés jusqu'en octobre. Il est important de souligner que ces chiffres représentent des engagements, pas des fonds déjà transférés : une grande partie de cet argent n'a pas encore atterri sur les comptes bancaires de l'entreprise. Cette opération confirme qu'OpenAI reste l'acteur le plus capitalisé de la course à l'intelligence artificielle générale, avec une capacité à mobiliser des partenaires stratégiques de premier plan. Pour Amazon, cet engagement massif renforce son positionnement dans l'IA au moment où AWS cherche à concurrencer Microsoft Azure, déjà partenaire historique d'OpenAI via un accord de plusieurs dizaines de milliards. Pour SoftBank, dont la stratégie repose sur des paris à long terme dans la tech, l'investissement reflète une conviction renouvelée dans le potentiel commercial de l'IA — après des années marquées par des paris controversés comme WeWork. Cette levée intervient dans un contexte de vive compétition entre les grands laboratoires d'IA, avec Anthropic (soutenu par Google et Amazon) et Google DeepMind en embuscade. Le calendrier des versements, lié en partie à une éventuelle introduction en Bourse d'OpenAI, illustre la pression croissante sur la startup pour monétiser ses produits et justifier des valorisations stratosphériques. Pendant ce temps, des tensions géopolitiques se font sentir : des menaces iraniennes visant des infrastructures technologiques américaines au Moyen-Orient font peser une incertitude supplémentaire sur un secteur déjà sous surveillance réglementaire intense en Europe et aux États-Unis.

UELa domination capitalistique renforcée d'OpenAI accentue la pression sur les régulateurs européens pour faire appliquer l'AI Act face à des acteurs américains aux moyens quasi-illimités.

💬 122 milliards sur le papier, c'est impressionnant, mais la moitié de cet argent n'existe pas encore vraiment : Amazon garde 35 milliards dans sa poche jusqu'à l'IPO, SoftBank échelonne sur deux ans. C'est le genre de levée où le communiqué de presse est deux fois plus gros que le chèque. Reste que même à moitié encaissé, ça fait une sacrée piste d'atterrissage pour OpenAI face à Anthropic et Google.

BusinessOpinion
1 source
Microsoft lance de nouvelles améliorations de Copilot combinant les modèles Anthropic et OpenAI
40The Information AI 

Microsoft lance de nouvelles améliorations de Copilot combinant les modèles Anthropic et OpenAI

Microsoft a dévoilé lundi de nouvelles fonctionnalités pour son logiciel 365 Copilot, intégrant simultanément les modèles d'intelligence artificielle d'OpenAI et d'Anthropic pour automatiser les tâches dans ses applications Office et Teams. Parmi les nouveautés, une fonction baptisée « Critique » combine les deux fournisseurs de manière séquentielle : les modèles d'OpenAI compilent d'abord une recherche sur un sujet donné, puis les modèles d'Anthropic (Claude) analysent et critiquent ce résultat pour en améliorer la qualité finale. Microsoft a également annoncé des améliorations à la mémoire de Copilot et à ses capacités d'agents autonomes. Cette intégration multi-modèles marque un tournant dans la stratégie de Microsoft : plutôt que de s'appuyer exclusivement sur son partenaire historique OpenAI — dans lequel il a investi plus de 13 milliards de dollars —, l'entreprise orchestre désormais plusieurs LLMs en fonction de leurs forces respectives. Pour les quelque 400 millions d'utilisateurs de la suite Microsoft 365, cela se traduit par des assistants plus fiables capables d'auto-corriger leurs propres sorties. Ce virage reflète une tendance de fond dans l'industrie : les grandes entreprises adoptent des architectures « multi-modèles » pour optimiser coût, performance et résilience. Microsoft, qui distribue aussi les modèles d'Anthropic via Azure, se positionne en orchestrateur neutre plutôt qu'en champion exclusif d'OpenAI. La relation entre les deux entreprises reste étroite, mais la dépendance s'allège — un signal fort à l'heure où Google, Meta et Amazon renforcent également leurs propres offres d'IA en entreprise.

UELes entreprises françaises et européennes équipées de Microsoft 365 bénéficieront directement des nouvelles capacités Copilot multi-modèles, sans surcoût ni migration requise.

OutilsOutil
1 source
Mistral AI lève 830 millions de dollars pour un centre de données IA
41AI Business 

Mistral AI lève 830 millions de dollars pour un centre de données IA

Mistral AI a annoncé avoir levé 830 millions de dollars pour financer la construction d'un centre de données dédié à l'intelligence artificielle, qui sera implanté en région parisienne. Cette infrastructure, alimentée par des milliers de puces Nvidia, représente l'un des investissements les plus importants jamais réalisés dans l'IA en Europe. La startup française, fondée en 2023, consolide ainsi sa position parmi les acteurs majeurs du secteur à l'échelle mondiale. Ce centre de calcul donnera à Mistral une capacité d'entraînement et d'inférence souveraine, réduisant sa dépendance aux infrastructures cloud américaines comme AWS ou Azure. Pour les entreprises et institutions européennes soucieuses de la localisation de leurs données, cette infrastructure sur sol français représente une alternative crédible aux géants américains. C'est aussi un signal fort sur la capacité de l'Europe à construire une filière IA complète, du modèle jusqu'au silicium. Mistral s'inscrit dans une course mondiale à la puissance de calcul où les États-Unis et la Chine investissent des dizaines de milliards. La France, qui a fait de l'IA souveraine une priorité industrielle, bénéficie ici d'un effet d'entraînement : après les annonces gouvernementales du plan France 2030, un acteur privé passe à l'acte à grande échelle. Les prochains mois diront si d'autres startups européennes suivront cette voie ou si Mistral restera une exception dans un paysage dominé par les hyperscalers américains.

UEMistral AI construit un centre de calcul souverain en région parisienne, offrant aux entreprises et institutions françaises et européennes une alternative locale aux hyperscalers américains pour l'hébergement et l'inférence IA sensibles.

💬 830 millions pour un datacenter, c'est le moment où Mistral arrête de jouer dans la cour des grands et devient un grand. Ce qui m'intéresse vraiment là-dedans, c'est la souveraineté d'inférence : des boîtes françaises qui pourront faire tourner des modèles sans que leurs données passent par Virginia ou Oregon. Reste à voir combien ça coûtera à l'usage.

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA
42Next INpact 

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA

Mistral AI a finalisé lundi 30 mars un emprunt de 830 millions de dollars (722 millions d'euros) auprès d'un pool de sept banques pour équiper son datacenter de Bruyères-le-Châtel, au sud de Paris. Cet argent servira à acquérir 13 800 puces GB300 de NVIDIA, les processeurs de dernière génération destinés aux charges d'IA intensives. Une fois déployée, cette infrastructure portera la puissance informatique disponible pour la startup à 44 mégawatts. Le financement mobilise une majorité d'acteurs français — Bpifrance, BNP Paribas, Crédit Agricole CIB, HSBC, La Banque Postale et Natixis — ainsi que la banque japonaise MUFG (groupe Mitsubishi). La mise en service est annoncée pour le deuxième trimestre 2026. Cet investissement positionne Mistral comme le premier opérateur d'infrastructure IA souveraine en Europe capable d'offrir à ses clients institutionnels une puissance de calcul hors de toute juridiction extraterritoriale américaine. C'est l'enjeu central de l'offre Mistral Compute, lancée en juin 2025 et déjà contractualisée avec le ministère des Armées français en janvier 2026. Pour les gouvernements, administrations et grandes entreprises qui cherchent à déployer des modèles IA sans dépendre d'AWS, Azure ou Google Cloud, cette infrastructure représente une alternative concrète et européenne — un argument commercial de poids dans un contexte de tensions géopolitiques et de débats sur la souveraineté numérique. Le projet avait été annoncé en février 2025, avec Eclairion — spécialiste français des datacenters haute densité — comme partenaire de construction. À l'époque, l'intégrateur britannique devenu américain Fluidstack était également associé au projet, mais Bloomberg indique qu'il a depuis réorienté ses investissements vers les États-Unis, laissant le champ plus libre à une configuration franco-française. En décembre 2025, le CEO d'Eclairion évoquait encore un cluster de puces GB200 comme « la plus grosse machine d'IA de France » sur le point d'entrer en production pour Mistral — les cartes semblent avoir été rebattues depuis, avec une transition vers les GB300, génération supérieure. En parallèle, Mistral a annoncé en février 2026 un second investissement de 1,2 milliard d'euros dans un autre projet de datacenter, confirmant une stratégie d'expansion infrastructure qui va bien au-delà du seul développement de modèles de langage. La startup cofondée par Arthur Mensch se construit désormais en fournisseur de cloud souverain à part entière.

UEMistral installe à Bruyères-le-Châtel la première infrastructure IA souveraine d'Europe hors juridiction américaine, déjà contractualisée avec le ministère des Armées français, offrant aux institutions et entreprises européennes une alternative concrète aux hyperscalers américains.

💬 722 millions d'euros de dette pour acheter des GPU, c'est pas anodin comme pari. Bon, sur le papier le timing est parfait : les gouvernements européens cherchent désespérément une sortie des hyperscalers américains, et Mistral vient d'arriver avec 13 800 GB300 et un contrat Armées déjà dans la poche. Ce qui me frappe surtout, c'est le pivot : on parle plus d'une boîte de modèles, mais d'un vrai fournisseur de cloud souverain.

InfrastructureOpinion
1 source
Mistral AI lève 830 millions de dollars en dette pour financer un datacenter près de Paris
43TechCrunch AI 

Mistral AI lève 830 millions de dollars en dette pour financer un datacenter près de Paris

Mistral AI a annoncé une levée de 830 millions de dollars sous forme de dette pour financer la construction d'un centre de données situé près de Paris. La startup française, fondée en 2023, prévoit de mettre en service cette infrastructure dès le deuxième trimestre 2026. Ce financement par dette — distinct d'une levée en capital — lui permet de préserver sa structure actionnariale tout en mobilisant des ressources massives pour déployer ses propres capacités de calcul. Cette décision marque un tournant stratégique majeur : disposer de son propre data center permettra à Mistral de réduire sa dépendance aux fournisseurs cloud américains comme AWS ou Azure, de maîtriser ses coûts d'inférence à grande échelle, et de répondre aux exigences de souveraineté numérique de clients institutionnels et gouvernementaux européens. Pour l'industrie, c'est un signal fort que les acteurs IA européens entendent concurrencer les géants américains sur leur propre terrain — celui de l'infrastructure. Mistral s'est imposée comme le principal champion européen de l'IA générative, avec des modèles comme Mistral Large et Mixtral. La France a fait de l'IA souveraine une priorité nationale, et la startup bénéficie d'un soutien politique fort. Alors que les besoins en puissance de calcul explosent avec la montée en charge des usages LLM, contrôler son infrastructure devient un avantage concurrentiel décisif — et un argument commercial de poids face aux entreprises européennes soucieuses de la localisation de leurs données.

UELa construction d'un data center souverain près de Paris par Mistral AI renforce l'autonomie numérique française et européenne, offrant aux institutions et entreprises de l'UE une alternative aux hyperscalers américains pour leurs besoins en calcul IA.

💬 830 millions en dette, pas en capital, c'est malin. Mistral garde la main sur son actionnariat tout en se construisant une infra qui va peser lourd dans les appels d'offres publics, ceux où "hébergé en France" n'est plus un bonus mais un prérequis. Reste à voir si le datacenter tourne vraiment au T2 2026 comme annoncé.

Mistral lève 830 millions d’euros pour financer un gros projet en France
4401net 

Mistral lève 830 millions d’euros pour financer un gros projet en France

Mistral AI a annoncé une levée de fonds de 830 millions d'euros sous forme de dette, quelques mois seulement après son précédent tour de table qui lui avait permis d'atteindre une valorisation de 6 milliards de dollars. Cette opération, l'une des plus importantes jamais réalisées par une start-up européenne dans le domaine de l'intelligence artificielle, vise à financer un projet d'infrastructure de grande envergure sur le territoire français. Cet afflux de capitaux doit permettre à Mistral de réduire sa dépendance aux infrastructures cloud américaines — Amazon Web Services, Microsoft Azure ou Google Cloud — qui dominent aujourd'hui le marché du calcul pour l'IA. En construisant sa propre capacité de calcul en France, la start-up entend maîtriser ses coûts à long terme tout en offrant à ses clients européens une alternative souveraine aux hyperscalers américains. Fondée en 2023 par d'anciens chercheurs de Google DeepMind et Meta, Mistral s'est imposée comme le principal rival européen d'OpenAI. Cette levée intervient dans un contexte de course effrénée aux ressources GPU, alors que les modèles de nouvelle génération exigent des investissements infrastructurels colossaux. La stratégie d'indépendance cloud de Mistral pourrait faire école auprès d'autres acteurs européens cherchant à s'affranchir de la tutelle des géants américains.

UEMistral construit une infrastructure de calcul souveraine en France, offrant aux entreprises et institutions européennes une alternative concrète aux hyperscalers américains.

💬 830 millions en dette, c'est un pari énorme sur leur capacité à monétiser vite. Ce qui m'intéresse, c'est pas la somme, c'est le choix de sortir des hyperscalers américains : si ça marche, Mistral contrôle ses marges ET son destin réglementaire. Reste à voir si les clients européens suivent vraiment, ou si AWS reste "plus simple" comme toujours.

Mistral AI sécurise 830 millions de dollars en dette pour exploiter son premier centre de données en France
45Maddyness 

Mistral AI sécurise 830 millions de dollars en dette pour exploiter son premier centre de données en France

Mistral AI a finalisé un financement par dette de 830 millions de dollars destiné à l'exploitation de son premier centre de données souverain en France. Cette opération, distincte d'une levée de fonds en capital classique, permet à la startup parisienne fondée en 2023 de conserver sa structure actionnariale tout en mobilisant des ressources massives pour une infrastructure physique propre. Ce passage à l'hébergement en propre marque un tournant stratégique majeur : Mistral ne dépend plus uniquement des hyperscalers américains comme AWS ou Azure pour faire tourner ses modèles. Disposer d'un datacenter français signifie une maîtrise totale de la chaîne de traitement des données, un argument de poids auprès des clients institutionnels et des gouvernements européens soucieux de souveraineté numérique. Ce mouvement s'inscrit dans une course mondiale à la puissance de calcul où les acteurs de l'IA réalisent que le contrôle de l'infrastructure est aussi stratégique que les modèles eux-mêmes. Mistral, qui compte parmi ses clients la Commission européenne et plusieurs États membres, consolide ainsi sa position de champion européen face aux géants américains. L'opération pourrait également préfigurer une introduction en bourse ou un partenariat industriel à grande échelle dans les mois à venir.

UEMistral AI construit un datacenter souverain en France, réduisant la dépendance aux hyperscalers américains et offrant aux institutions publiques et gouvernements européens une alternative crédible pour le traitement souverain des données.

💬 C'est le move qu'on attendait depuis que Mistral a commencé à vendre aux gouvernements. Un datacenter souverain en France, c'est pas un bonus symbolique, c'est la condition pour décrocher les gros contrats institutionnels sans que personne te demande où tournent les données. Et 830 millions en dette plutôt qu'en capital, ça dit beaucoup sur leur ambition : ils préservent l'actionnariat pour ce qui vient après.

MISTRAL mobilise 705 millions d’euros pour son data center et avancerait désormais seul
46FrenchWeb 

MISTRAL mobilise 705 millions d’euros pour son data center et avancerait désormais seul

Mistral AI a annoncé une levée de dette de 705 millions d'euros destinée à financer la construction d'un centre de données aux portes de Paris. L'objectif central de cette opération est l'acquisition de 13 800 GPU Nvidia, ce qui permettrait à la startup française d'internaliser une capacité de calcul significative jusqu'ici dépendante de fournisseurs cloud tiers. Cette annonce marque un tournant stratégique majeur pour la jeune entreprise, fondée en 2023 et déjà valorisée plusieurs milliards d'euros. Ce virage infrastructurel confère à Mistral un contrôle direct sur ses coûts de formation et d'inférence, réduisant sa dépendance aux grandes plateformes cloud américaines comme AWS ou Azure. Posséder sa propre puissance de calcul est désormais considéré comme un impératif compétitif dans la course aux modèles de langage avancés — ceux qui nécessitent des dizaines de milliers de GPU pour s'entraîner. Pour l'écosystème européen de l'IA, un tel investissement représente aussi un signal fort : la souveraineté numérique passe désormais par la maîtrise du silicium. Cette décision s'inscrit dans un contexte où l'IA mondiale franchit une nouvelle phase, après deux ans centrés sur la course aux modèles. Les acteurs qui ne contrôlent pas leur infrastructure risquent d'être dépendants — techniquement et financièrement — des hyperscalers américains. Mistral semble par ailleurs vouloir avancer en autonomie accrue, sans nouveaux partenaires stratégiques majeurs pour cette opération, ce qui suggère une montée en maturité et une volonté d'indépendance industrielle assumée.

UEL'investissement de Mistral dans un data center francilien avec 13 800 GPU Nvidia constitue un acte concret de souveraineté numérique européenne, réduisant la dépendance des acteurs français aux hyperscalers américains pour l'entraînement et l'inférence de modèles IA.

💬 705 millions en dette pour 13 800 GPU, c'est un pari énorme. Ce qui me frappe surtout, c'est qu'ils avancent seuls, sans nouveau partenaire au capital, ce qui veut dire soit qu'ils ont vraiment les reins solides, soit que les discussions n'ont rien donné de satisfaisant. Reste à voir si l'infra suit quand les modèles de prochaine génération demanderont le double.

InfrastructureOpinion
1 source
Microsoft lance un agent Azure Copilot pour accélérer la planification des migrations cloud
47InfoQ AI 

Microsoft lance un agent Azure Copilot pour accélérer la planification des migrations cloud

Microsoft a lancé l'Azure Copilot Migration Agent, un assistant IA intégré directement au portail Azure, destiné à accélérer la planification des migrations vers le cloud. L'outil automatise trois tâches clés : la découverte sans agent des environnements VMware, la planification de migration et la création de zones d'atterrissage (landing zones). Présenté comme disponible en général (GA), le service est en réalité toujours en préversion publique — une nuance importante que Microsoft n'a pas mise en avant. La promesse est de réduire significativement le temps consacré à la phase d'évaluation et de préparation, souvent la plus fastidieuse des projets de migration cloud. Pour les équipes IT gérant des parcs VMware importants, la découverte automatique des machines virtuelles sans installation d'agent représente un gain opérationnel réel. Cependant, l'outil ne peut pas exécuter les migrations lui-même : la réplication des données et le basculement (cutover) restent des opérations manuelles dans Azure Migrate, ce qui limite son périmètre à la planification seule. Ce lancement s'inscrit dans un contexte favorable à Microsoft : depuis le rachat de VMware par Broadcom en 2023 et la hausse brutale des licences qui a suivi, de nombreuses entreprises cherchent à migrer leurs workloads vers des alternatives cloud. Azure est l'un des principaux bénéficiaires de cet exode, aux côtés d'AWS et Google Cloud. En automatisant la phase de planification, Microsoft cherche à abaisser la barrière d'entrée et à accélérer les décisions de migration — tout en restant prudent sur ce qu'il promet réellement livrer à ce stade.

UELes entreprises françaises et européennes contraintes de quitter VMware suite aux hausses de licences Broadcom peuvent utiliser cet outil pour accélérer leur planification de migration vers Azure.

OutilsActu
1 source
Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez
48Les Numériques IA 

Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez

Microsoft a annoncé en mars 2026 une modification de sa politique de données pour GitHub Copilot : les données des utilisateurs — incluant le code, les interactions et les comportements sur la plateforme — seront désormais utilisées pour entraîner ses modèles d'intelligence artificielle, sauf si les utilisateurs se désinscrivent explicitement via les paramètres de leur compte. Ce changement concerne l'ensemble des utilisateurs de GitHub Copilot, qu'ils soient en version gratuite ou payante, et prend effet dans les prochaines semaines. Pour des millions de développeurs, cela signifie que leur code — parfois propriétaire ou sensible — pourrait contribuer à améliorer les outils IA de Microsoft sans action de leur part. Le mécanisme d'opt-out existe, mais il repose sur la démarche active de l'utilisateur, ce qui, statistiquement, laisse la grande majorité des données accessibles. Pour les entreprises qui utilisent GitHub en environnement professionnel, la question de la confidentialité du code source devient immédiatement critique. Microsoft a racheté GitHub en 2018 pour 7,5 milliards de dollars, un investissement dont la rentabilisation passe largement par Copilot, lancé en 2021 et aujourd'hui intégré dans l'écosystème Visual Studio et Azure. La firme de Redmond s'inscrit ainsi dans une tendance plus large : OpenAI, Google et Meta ont tous adopté des politiques similaires d'utilisation des données utilisateurs pour affiner leurs modèles. La pression réglementaire européenne, notamment via le RGPD, pourrait cependant contraindre Microsoft à adapter ces pratiques pour les utilisateurs de l'Union européenne.

UELes développeurs européens utilisant GitHub Copilot doivent se désinscrire activement pour protéger leur code propriétaire ; le RGPD pourrait contraindre Microsoft à imposer un mécanisme d'opt-in explicite pour les utilisateurs de l'UE.

ÉthiqueReglementation
1 source
49The Decoder 

OpenAI : l'accord avec AWS pourrait fragiliser l'exclusivité de Microsoft sur Azure

OpenAI a conclu un accord avec AWS (Amazon Web Services), ce qui inquiète Microsoft : ce partenariat pourrait violer les droits d'exclusivité prévus dans leur contrat avec Azure. Microsoft craint que l'utilisation de l'infrastructure cloud d'Amazon par OpenAI ne contrevienne à leurs engagements contractuels.

BusinessOpinion
1 source
Microsoft s'inquiète qu'un produit OpenAI-AWS puisse violer son contrat Azure
50The Information AI 

Microsoft s'inquiète qu'un produit OpenAI-AWS puisse violer son contrat Azure

Microsoft s'inquiète qu'un accord entre OpenAI et Amazon Web Services viole le contrat d'exclusivité liant OpenAI à Azure. Des cadres supérieurs de Microsoft ont exprimé des préoccupations après qu'OpenAI a annoncé le lancement d'un agent IA via AWS, potentiellement en contradiction avec l'obligation de faire tourner ses modèles exclusivement sur le cloud Azure. La situation laisse entrevoir une fracture croissante entre les deux partenaires historiques.

BusinessActu
1 source

Suivre Azure en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour