Aller au contenu principal

Microsoft· sujet

1056 articlesmis à jour le 2026-06-09

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Hub d'actualité sur Microsoft, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA
250 2%
articles (vs 30j préc.)
19.6%
de la couverture IA
Souvent associé à
OpenAIAgenticAnthropicCopilot StudioFLUX

Part de voix = part des articles IA de la période mentionnant Microsoft. Voir le Baromètre IA complet

À retenir · 30 derniers jours

Microsoft occupe une position particulière dans l'IA : celle d'un acteur installé partout. Sa participation et son partenariat avec OpenAI lui ont donné une longueur d'avance, en transformant les modèles GPT en produits vendus à des centaines de millions d'utilisateurs. Ce lien reste structurant, même si les deux entreprises ajustent régulièrement les termes de leur collaboration et avancent désormais sur des trajectoires en partie distinctes.

La vraie force de Microsoft tient à sa distribution. L'IA est désormais branchée sur toute la gamme : Copilot dans Office et Windows, Azure AI pour les développeurs et les entreprises, intégrations dans Teams, Outlook ou GitHub. En parallèle, l'entreprise développe ses propres modèles maison pour réduire sa dépendance à un fournisseur unique et mieux maîtriser ses coûts. Pour un professionnel, l'enjeu n'est pas la technologie brute mais le fait que ces outils arrivent déjà dans des logiciels utilisés chaque jour.

Cette omniprésence nourrit aussi les grands débats. Concentration du cloud entre quelques mains, dépendance croissante des organisations, questions de sécurité et de souveraineté des données : Microsoft est au centre de chacun d'eux.

Dans ce hub, nous suivons l'évolution de Copilot et d'Azure, la relation avec OpenAI, les modèles maison, et ce que ces choix changent concrètement pour les entreprises et leurs données.

Toute l'actualité Microsoft

Flux automatique. Articles classés par pertinence, agrégés en continu.

Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code
1Next INpact SécuritéOpinion

Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code

Microsoft a dû désactiver l'accès à plus de 70 de ses propres dépôts GitHub suite à une campagne d'attaques nommée « Miasma », révélée début juin 2026. Parmi les dépôts compromis figurent des projets critiques comme « Azure/functions-action », utilisé pour déployer du code sur Azure Functions, et le framework Durable Task, décrit comme « utilisé activement en production par de nombreuses équipes d'ingénierie au sein de Microsoft ». L'entreprise de sécurité StepSecurity a identifié le vecteur précis : un commit malveillant poussé dans le dépôt Azure/durabletask via un compte de contributeur piraté, ajoutant cinq fichiers conçus pour s'exécuter automatiquement dans quatre environnements de développement. Le code s'active dès qu'un développeur ouvre le dépôt dans Claude Code, Gemini CLI, Cursor ou VS Code, avec pour objectif de dérober des identifiants. L'impact est particulièrement insidieux car l'attaque ne repose sur aucune faille technique de GitHub ou de npm, mais exploite la confiance accordée aux flux de publication légitimes. En s'emparant des identifiants d'un mainteneur, les attaquants ont pu demander un jeton OIDC GitHub valide, publier une version infectée avec une provenance SLSA authentique, et contourner ainsi les scanners de sécurité conventionnels qui l'ont traitée comme une mise à jour de routine. Comme le souligne l'entreprise Cloudsmith, « le ver s'est fondu dans les flux de travail légitimes » : les paquets malveillants portaient des signatures cryptographiques valides, indiscernables de celles d'un éditeur légitime. Les développeurs qui clonent un dépôt ne sont pas exposés, mais ceux qui l'ouvrent directement dans leur IDE l'étaient. Paradoxalement, c'est l'équipe de sécurité de Microsoft elle-même qui avait détecté Miasma en premier, non pas dans ses propres projets, mais chez Red Hat le 2 juin, où 32 paquets npm du périmètre @redhat-cloud-services avaient été modifiés dans plus de 90 versions. StepSecurity relie cette campagne à une attaque antérieure, « Mini Shai-Hulud », menée par le groupe TeamPCP, les deux opérations partageant un même domaine de commande et contrôle. Le compte piraté chez Microsoft est le même dont les identifiants avaient servi lors d'une attaque contre PyPI le 19 mai. Cette série d'incidents illustre une tendance de fond : la compromission des identifiants développeurs comme point d'entrée privilégié dans la chaîne d'approvisionnement logicielle, un vecteur d'autant plus difficile à contrer que les outils de vérification d'intégrité comme SLSA ne distinguent pas un éditeur authentique d'un attaquant ayant volé ses clés.

UELes développeurs européens utilisant Claude Code, Gemini CLI, Cursor ou VS Code sont directement exposés au vol de credentials s'ils ont ouvert des dépôts Microsoft ou Red Hat compromis dans ces environnements.

1 source
Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)
201net 

Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)

Apple s'apprête à transformer radicalement Siri en 2026, en intégrant l'intelligence artificielle générative ainsi que le modèle Gemini de Google au coeur de son assistant vocal. Cette refonte majeure dotера Siri d'une interface redessinée, d'une voix personnalisable et d'une capacité de compréhension contextuelle nettement améliorée, capable de produire des réponses plus précises et adaptées aux besoins de chaque utilisateur. Une nouvelle application dédiée permettra également de consulter l'historique complet des conversations et de synchroniser toutes les interactions sur l'ensemble des appareils Apple. Cette mise à jour représente un tournant pour Apple, qui accuse un retard significatif face à des concurrents comme OpenAI avec ChatGPT, Google avec Gemini ou Microsoft avec Copilot. L'intégration de l'IA générative devrait transformer Siri d'un assistant limité en un véritable copilote numérique capable de raisonner, d'enchaîner des tâches complexes et de maintenir le fil d'une conversation sur la durée. Pour les quelque 2 milliards d'utilisateurs d'appareils Apple dans le monde, cela représente un changement d'usage potentiellement profond. Le déploiement ne sera cependant pas immédiat ni universel : l'Europe, soumise aux contraintes réglementaires du Digital Markets Act, devra attendre une date encore indéfinie avant d'accéder à ces fonctionnalités. Ce retard illustre la tension croissante entre les ambitions des géants technologiques américains et le cadre législatif européen. Apple avait déjà retardé plusieurs fonctions d'Apple Intelligence dans l'Union européenne pour des raisons similaires, laissant les utilisateurs du Vieux Continent en marge des dernières avancées de la plateforme.

UELes utilisateurs européens d'appareils Apple devront attendre une date indéfinie avant d'accéder aux nouvelles fonctionnalités de Siri AI, le Digital Markets Act imposant des contraintes réglementaires qui excluent temporairement l'UE de ce déploiement majeur.

💬 Siri avec du raisonnement contextuel et Gemini derrière, c'est quand même pas rien pour 2 milliards d'appareils. Apple accusait un retard visible depuis des années, tout le monde le voyait, et là c'est enfin du concret. En Europe on attend encore, le DMA fait son travail, et on commence à s'y habituer.

OutilsOpinion
1 source
Les sous-titres détaillés surpassent le volume brut pour entraîner des générateurs d'images efficaces, selon Lens de Microsoft Research
3The Decoder 

Les sous-titres détaillés surpassent le volume brut pour entraîner des générateurs d'images efficaces, selon Lens de Microsoft Research

Microsoft Research a publié Lens, un modèle de génération d'images à partir de texte doté de seulement 3,8 milliards de paramètres, capable de rivaliser avec des modèles bien plus volumineux sur les benchmarks standard, à une fraction du coût d'entraînement habituel. La clé de cette performance réside dans les données : au lieu de s'appuyer sur les descriptions alternatives vagues issues du web, l'équipe a généré 800 millions de légendes d'images très détaillées à l'aide de GPT-4.1. Le code source et les poids du modèle ont été publiés sous licence open source. Ce résultat remet en question une hypothèse dominante dans l'industrie de l'IA : celle selon laquelle il faudrait toujours plus de paramètres et de données brutes pour obtenir de meilleures performances. Lens démontre qu'un modèle compact, nourri de données de haute qualité, peut égaler des modèles propriétaires bien plus lourds. Pour les équipes disposant de ressources limitées, cela ouvre la voie à des pipelines de génération d'images performants sans investissement massif en infrastructure. Cette publication s'inscrit dans une tendance qui valorise la qualité des données d'entraînement plutôt que leur quantité brute, une philosophie déjà portée par des modèles comme Phi chez Microsoft lui-même. L'utilisation de GPT-4.1 pour générer des descriptions riches et précises rappelle les approches de recaptioning adoptées par Stability AI ou Adobe Firefly. En rendant Lens accessible à tous, Microsoft Research contribue à démocratiser la recherche en génération visuelle, et pourrait accélérer l'émergence de modèles spécialisés plus efficaces dans des domaines comme le design, la médecine ou l'éducation.

UELa publication open source de Lens permet aux équipes de recherche et startups européennes de développer des pipelines de génération d'images performants sans infrastructure coûteuse.

RecherchePaper
1 source
Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles
4AWS ML Blog 

Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles

Amazon Web Services a introduit une fonctionnalité appelée Cross-Region Inference (CRIS) dans Amazon Bedrock, son service d'IA générative managé, permettant aux entreprises européennes de router automatiquement leurs requêtes d'inférence vers plusieurs régions AWS au sein de zones géographiques prédéfinies. Concrètement, lorsqu'une application envoie une requête à un modèle comme Claude d'Anthropic ou un modèle Amazon Nova, CRIS peut la rediriger dynamiquement vers la région disposant de la meilleure capacité disponible, tout en maintenant les données dans un périmètre géographique contrôlé. Pour l'Europe, AWS propose des profils EU CRIS dont toutes les régions de destination sont situées exclusivement au sein de l'Union européenne. Les données transmises restent chiffrées et circulent uniquement sur le réseau privé AWS, sans jamais transiter par l'internet public. Ce mécanisme répond à un problème concret que rencontrent les entreprises européennes : la saturation des capacités de calcul GPU en période de forte demande, qui se traduit par des latences élevées ou des erreurs de disponibilité. En distribuant les requêtes sur plusieurs régions, les applications deviennent plus résilientes aux pics de charge et aux pannes locales. Du point de vue réglementaire, les profils EU CRIS sont conçus pour faciliter la conformité au RGPD, puisque le traitement reste borné à l'UE, un critère déterminant pour les secteurs soumis à des exigences strictes de résidence des données comme la finance, la santé ou les services publics. AWS souligne également que certains modèles sont disponibles à tarif réduit via les profils globaux CRIS, ajoutant un argument économique à l'argument technique. La pression réglementaire européenne sur le traitement des données par des fournisseurs cloud américains s'est intensifiée ces dernières années, notamment après les décisions de la CJUE sur les transferts transatlantiques de données. Les grands hyperscalers comme AWS, Google Cloud et Microsoft Azure ont tous investi massivement dans des infrastructures européennes et des offres de souveraineté pour répondre à ces contraintes. CRIS s'inscrit dans cette logique : plutôt que de forcer les clients à choisir une seule région et à subir ses limitations de capacité, AWS propose une abstraction qui optimise automatiquement tout en respectant les frontières réglementaires. La prochaine étape logique sera l'extension de ces profils géographiques à d'autres zones comme le Moyen-Orient ou l'Asie-Pacifique, et l'intégration de contrôles plus fins permettant aux entreprises de définir elles-mêmes les régions autorisées selon leurs obligations contractuelles ou sectorielles.

UELa fonctionnalité EU CRIS d'AWS Bedrock permet aux entreprises européennes de maintenir leurs traitements d'inférence IA exclusivement dans les frontières de l'UE, facilitant la conformité RGPD pour les secteurs finance, santé et services publics soumis à des exigences strictes de résidence des données.

InfrastructureOpinion
1 source
Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2
5InfoQ AI 

Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2

Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme Azure dédiée au déploiement d'équipes d'agents IA autonomes pour la recherche scientifique. C'est cette même plateforme qui a piloté le développement de Majorana 2, une puce quantique topologique affichant une fiabilité multipliée par 1 000 par rapport aux générations précédentes, avec des durées de vie de qubits atteignant 20 secondes. Microsoft fixe désormais à 2029 l'horizon d'un ordinateur quantique opérationnel à grande échelle, soit deux fois plus tôt que son calendrier initial. L'enjeu est considérable : un ordinateur quantique suffisamment fiable permettrait de résoudre des problèmes inaccessibles aux supercalculateurs classiques, notamment en chimie moléculaire, en cryptographie ou en optimisation logistique. En mettant ses agents IA au service de la conception de hardware quantique, Microsoft franchit une étape symbolique forte : l'IA ne se contente plus d'assister les chercheurs humains, elle orchestre elle-même des cycles d'expérimentation scientifique bout en bout. La course au quantique s'intensifie avec Google, IBM et plusieurs startups comme IonQ ou PsiQuantum comme principaux concurrents. Microsoft mise sur une architecture topologique reposant sur les qubits de Majorana, jugés intrinsèquement plus stables que les qubits supraconducteurs privilégiés par ses rivaux. La combinaison de cette approche matérielle distinctive et d'une plateforme IA agentique directement accessible sur Azure positionne Microsoft comme un acteur à double avantage dans la prochaine phase de la compétition quantique mondiale.

UELa disponibilité sur Azure en Europe donne aux laboratoires et entreprises de recherche de l'UE un accès à cette plateforme d'IA agentique pour la recherche scientifique, sans impact réglementaire ou institutionnel direct pour la France.

InfrastructureActu
1 source
Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides
6MarkTechPost 

Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides

Microsoft a dévoilé la semaine dernière MAI-Transcribe-1.5, la deuxième génération de son modèle de reconnaissance vocale développé en interne. Ce système de transcription automatique prend en charge 43 langues, contre 25 pour la version précédente, avec dix-huit nouvelles langues ajoutées sans dégradation des performances, dont le bengali, le tamoul, le télougou côté Asie du Sud, et l'ukrainien, le grec ou le catalan côté Europe. Sur le benchmark multilingue FLEURS, Microsoft revendique la première place parmi les modèles du marché. Sur le classement Artificial Analysis, le modèle affiche un taux d'erreur par mot (WER) de 2,4 %, ce qui le place troisième dans un champ concurrentiel. En vitesse, il est capable de transcrire une heure d'audio en moins de 15 secondes et se révèle jusqu'à 5 fois plus rapide que des modèles comparables comme Gemini 3.1, Scribe v2 ou GPT-4o-Transcribe sur des fichiers longs. MAI-Transcribe-1.5 est intégré à Copilot, Teams, GitHub et Dynamics 365 Contact Centre, et disponible via Foundry, la plateforme de modèles de Microsoft. La fonctionnalité qui mérite le plus d'attention est le « keyword biasing », ou biais par entités nommées. Les transcripteurs génériques trébuchent régulièrement sur les vocabulaires métiers, noms propres, termes médicaux, acronymes internes, précisément là où les erreurs coûtent le plus cher. MAI-Transcribe-1.5 permet de fournir jusqu'à 200 mots-clés personnalisés que le modèle prend en compte lors de la transcription, sans forcer mécaniquement les correspondances mais en s'appuyant sur le contexte. Résultat : une réduction de 30 % du WER sur FLEURS lorsque ce mécanisme est activé. Sur les réunions d'entreprise, dans les centres d'appels ou les environnements de santé, cette capacité change concrètement la qualité des transcriptions produites. La détection automatique de la langue parlée, sans paramétrage manuel, complète l'ensemble pour des flux d'entrée non structurés. La course aux modèles de transcription s'est considérablement intensifiée depuis que OpenAI a popularisé Whisper et que des acteurs comme AssemblyAI ou ElevenLabs ont investi le segment entreprise. Microsoft, fort de son infrastructure Azure et de son intégration profonde dans les outils de productivité, cherche à imposer une solution maison plutôt que de dépendre de fournisseurs tiers. Le passage de 25 à 43 langues, avec une couverture renforcée des langues d'Asie du Sud, reflète aussi une ambition de croissance sur des marchés où l'anglais n'est pas dominant. Pour les équipes qui traitent des archives audio volumineuses en batch, médias, justice, santé, support client, un facteur de vitesse de 5x sur les fichiers longs n'est pas anecdotique : il réduit directement les coûts d'infrastructure et les délais de traitement à grande échelle.

UELes entreprises européennes intégrées à l'écosystème Microsoft (Teams, Dynamics 365) bénéficieront directement de ces gains de précision et de vitesse, avec un support renforcé des langues européennes comme le grec, le catalan et l'ukrainien.

OutilsOpinion
1 source
Le directeur IA de Microsoft affirme que l'entreprise est "libérée" d'OpenAI pour poursuivre la superintelligence
7VentureBeat AI 

Le directeur IA de Microsoft affirme que l'entreprise est "libérée" d'OpenAI pour poursuivre la superintelligence

Mustafa Suleyman, directeur de Microsoft AI, a révélé lors de Microsoft Build 2026 qu'un changement contractuel conclu il y a environ six mois avec OpenAI a officiellement autorisé sa division à développer de manière autonome ce qu'il appelle ouvertement la "superintelligence". Cette annonce, faite en coulisses du Fort Mason Center à San Francisco, s'est accompagnée d'une démonstration concrète : Microsoft a présenté une famille de sept modèles d'IA entièrement développés en interne par son équipe AI Superintelligence Team, regroupés sous le nom "MAI". Le modèle phare, MAI-Thinking-1, est un modèle de raisonnement de 35 milliards de paramètres actifs qui, selon Microsoft, rivalise avec les meilleurs modèles de sa catégorie sur les benchmarks d'ingénierie logicielle et de raisonnement mathématique. La famille comprend également MAI-Code-1-Flash pour GitHub Copilot et VS Code, MAI-Image-2.5 pour la génération et l'édition d'images, MAI-Transcribe-1.5 couvrant 43 langues, et MAI-Voice-2 pour la synthèse vocale multilingue. Tous sont disponibles via Microsoft Foundry, et pour la première fois, les développeurs peuvent ajuster les poids des modèles via des plateformes tierces comme OpenRouter, Fireworks et Baseten. Ce virage stratégique marque une rupture significative pour une entreprise dont l'identité en matière d'IA était jusqu'ici presque entièrement définie par son partenariat avec OpenAI, dans lequel elle a investi un total cumulé dépassant 13 milliards de dollars. Le point le plus frappant du discours de Suleyman n'est pas la liste de modèles, mais la philosophie qui les sous-tend : tous sont entraînés depuis zéro sur des données propres et commercialement licenciées, sans distillation à partir de modèles tiers. Cette position contraste directement avec une pratique répandue dans l'industrie, où les labs utilisent les sorties de modèles concurrents pour entraîner leurs propres systèmes. Pour les entreprises clientes soucieuses de la traçabilité des données et des risques juridiques liés au copyright, ce choix représente un argument différenciant concret. La relation avec OpenAI n'est pas rompue pour autant, mais elle se transforme. Pendant des années, un arrangement contractuel spécifique limitait la capacité de Microsoft à construire ses propres modèles de frontier, la positionnant davantage comme distributeur et intégrateur que comme laboratoire de recherche à part entière. L'assouplissement de ces clauses il y a six mois marque donc un tournant institutionnel autant que technique. Suleyman l'a clairement formulé : l'objectif est qu'en 2030 et au-delà, Microsoft soit capable de "construire les meilleurs modèles au monde", et non plus seulement de les acheter. Cette transition sera longue, et les sept modèles annoncés ne sont qu'une preuve de concept. Ce qui se joue ici, c'est la capacité de Microsoft à devenir un acteur de recherche fondamentale en IA, aux côtés d'OpenAI, Google DeepMind et Anthropic, plutôt que dans leur ombre.

UEPour les entreprises et développeurs européens utilisant Azure ou GitHub Copilot, la famille MAI, entraînée exclusivement sur des données licenciées, constitue un argument de conformité potentiellement pertinent face aux exigences de traçabilité de l'AI Act et au droit d'auteur européen.

💬 Le plus intéressant dans cette histoire, c'est pas les sept modèles, c'est le changement contractuel signé il y a six mois dans la plus grande discrétion. Microsoft s'est reconstruite une liberté de recherche sans rompre avec OpenAI, c'est bien joué. Et le choix d'entraîner depuis zéro sur des données licenciées, sans distillation depuis les concurrents, ça pèse lourd pour les boîtes qui naviguent avec l'AI Act.

LLMsOpinion
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
8VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source
Satya Nadella fustige le plan d'un vice-président visant à rendre l'agent IA de Microsoft délibérément addictif
9The Decoder 

Satya Nadella fustige le plan d'un vice-président visant à rendre l'agent IA de Microsoft délibérément addictif

Satya Nadella, PDG de Microsoft, a vivement recadré en interne un vice-président de l'entreprise après la fuite d'un mémo proposant de rendre les utilisateurs "accros" à Scout, le nouvel agent IA de Microsoft. Dans un message envoyé à une cinquantaine d'ingénieurs seniors, Nadella a réagi publiquement à cette note interne en écrivant : "Je ne sais pas qui écrit et fait fuiter ces idioties." La sortie est rare pour un dirigeant de son rang, signe que le sujet a touché une corde sensible au plus haut niveau de l'entreprise. La prise de position de Nadella est significative car elle tranche avec une tendance bien ancrée dans l'industrie technologique, où l'engagement maximal des utilisateurs a longtemps été un objectif explicite de conception. En affirmant que Scout devrait au contraire conduire à moins de temps passé sur écran, le PDG de Microsoft adopte une posture radicalement différente de celle qui a présidé au développement des réseaux sociaux et de nombreuses applications mobiles. Pour les utilisateurs professionnels visés par Scout, cela suggère un outil conçu pour l'efficacité plutôt que pour la dépendance. Microsoft déploie Scout dans un contexte de concurrence acharnée avec Google, OpenAI et d'autres acteurs sur le marché des agents IA. La fuite de ce mémo interne révèle les tensions qui peuvent exister au sein même des grandes entreprises tech sur la direction éthique à donner à ces nouveaux outils. La réaction publique de Nadella envoie un signal clair sur la culture qu'il entend imposer, à un moment où la régulation de l'IA et les questions d'éthique numérique sont au cœur des débats législatifs en Europe et aux États-Unis.

UELa prise de position de Nadella contre la conception addictive des agents IA pourrait servir de référence dans les débats européens sur la régulation de l'IA, notamment autour des obligations de conception responsable imposées par l'AI Act.

💬 Nadella qui tance publiquement un VP pour avoir proposé de rendre Scout addictif, c'est rare. Ce que je trouve presque plus intéressant que le recadrage lui-même, c'est que le mémo a existé : ça montre que le réflexe "maximise l'engagement" est encore bien vivant dans les équipes, même chez Microsoft. Bon, un message à 50 ingénieurs ça ne change pas une culture, mais ça plante un drapeau.

ÉthiqueOpinion
1 source
Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle
10InfoQ AI 

Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle

Karthik Ramgopal et Prince Valluri, ingénieurs chez LinkedIn, ont présenté leur approche pour déployer l'intelligence artificielle à grande échelle au sein d'une organisation de plusieurs milliers de développeurs. Plutôt que de laisser chaque équipe construire ses propres solutions en silo, ils ont mis en place une couche d'abstraction commune reposant sur le protocole MCP (Model Context Protocol) pour orchestrer des agents, structurer le contexte et sécuriser l'accès aux outils internes. Cette architecture a permis de déployer concrètement trois types d'agents en production : des agents de génération de code, des agents d'observation système et des agents de test d'interface utilisateur. L'enjeu est considérable pour les grandes entreprises technologiques : sans infrastructure partagée, chaque équipe réinvente la roue et les agents IA restent des expérimentations isolées sans impact à l'échelle. En centralisant l'orchestration et la gestion du contexte via une plateforme commune, LinkedIn parvient à transformer l'IA en véritable moteur d'exécution engineering, capable d'automatiser des tâches complexes comme les tests UI ou la surveillance de systèmes distribués, avec des garanties de sécurité homogènes. Cette initiative s'inscrit dans une tendance de fond : les grandes entreprises tech passent du stade des prototypes d'agents IA à celui des déploiements industriels, ce qui exige des équipes plateformes dédiées. Le protocole MCP, porté initialement par Anthropic et rapidement adopté par l'industrie, s'impose comme standard d'interopérabilité entre agents et outils. LinkedIn, filiale de Microsoft, bénéficie par ailleurs d'un accès privilégié aux modèles GPT-4o via Azure, ce qui accélère ces expérimentations à une échelle que peu d'entreprises peuvent atteindre.

UELes équipes d'ingénierie européennes peuvent s'inspirer de cette architecture MCP pour structurer leurs propres déploiements d'agents IA à l'échelle, le protocole MCP s'imposant comme standard industriel d'interopérabilité.

💬 MCP en prod chez LinkedIn sur des milliers de devs, c'est le signal qu'on attendait pour que le protocole bascule vraiment en standard industriel. Ce qui est intéressant là-dedans, c'est pas la tech en elle-même (Anthropic a bien bossé le design), c'est l'architecture plateforme : une couche commune au lieu que chaque équipe réinvente ses propres outils d'orchestration dans son coin. Reste à voir ce que ça donne pour les boîtes qui n'ont pas Azure et GPT-4o derrière.

InfrastructureOpinion
1 source
Microsoft a entraîné ses modèles MAI sur des données web sans licence, malgré sa promesse de données propres et licenciées
11The Decoder 

Microsoft a entraîné ses modèles MAI sur des données web sans licence, malgré sa promesse de données propres et licenciées

Microsoft a entraîné ses nouveaux modèles MAI en partie sur des données web non licenciées, dont Common Crawl, un vaste corpus de pages aspirées sans accord explicite des éditeurs. Cette pratique contredit directement le discours commercial de l'entreprise, qui promettait à ses clients professionnels l'utilisation exclusive de données "de qualité enterprise, propres et commercialement licenciées", une formulation censée distinguer Microsoft de tous les autres laboratoires d'IA. Pour les entreprises qui ont choisi les modèles MAI sur la foi de garanties juridiques solides, la révélation fragilise la promesse centrale de Microsoft. La question de la propriété intellectuelle dans l'entraînement des modèles de langage est au coeur de nombreuses procédures judiciaires en cours aux États-Unis et en Europe. Les clients entreprise paient précisément pour éviter l'exposition légale qu'implique l'utilisation de données sans accord, et si cette assurance ne tient pas, la différenciation commerciale s'effondre. Comme OpenAI, Google ou Meta avant lui, Microsoft s'appuie en réalité sur la doctrine américaine du "fair use" pour justifier l'aspiration de contenus web publics, tout en reportant la charge sur les propriétaires de sites qui souhaitent bloquer ses robots d'exploration. L'entreprise avait pourtant explicitement choisi de se démarquer de cette pratique dans son marketing. Cette contradiction entre promesses commerciales et réalité technique risque d'alimenter une méfiance croissante, alors que régulateurs européens et américains scrutent de plus en plus les méthodes d'entraînement des grands modèles de langage.

UELes régulateurs européens qui examinent les pratiques d'entraînement des LLMs pourraient s'appuyer sur cette contradiction entre les promesses commerciales de Microsoft et ses pratiques réelles pour durcir les exigences de transparence sur l'origine des données dans le cadre de l'AI Act.

💬 Le problème, c'est pas Common Crawl, c'est le mensonge commercial. Microsoft avait explicitement promis à ses clients enterprise des données "propres et licenciées", exactement pour se distinguer d'OpenAI et Google. Si tu avais choisi MAI pour cette garantie juridique, t'as un vrai sujet aujourd'hui.

ÉthiqueActu
1 source
Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA
12Next INpact 

Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA

Le Canard Enchaîné a affirmé, dans son édition du 2 juin 2026, que Doctolib transmettait les données de ses utilisateurs à Microsoft, Anthropic et Google dans le but d'entraîner leurs grands modèles de langage. L'article vise notamment l'assistant de consultation que la licorne française commercialise depuis 2024 auprès des professionnels de santé. Ce service écoute les consultations médicales, avec l'accord du patient, pour générer automatiquement comptes-rendus et courriers. Or, les documents contractuels de Doctolib consultés par la rédaction de Next confirment que Microsoft Azure, Anthropic et Google Irlande figurent bien dans la liste des « sous-traitants ultérieurs » de l'entreprise, avec pour service déclaré la « fourniture du modèle de LLM » et pour finalité l'« analyse et création de contenu à des fins d'automatisation de tâches ». Doctolib dément catégoriquement que ces données médicales servent à entraîner les modèles de ses fournisseurs. Selon un porte-parole de l'entreprise, Microsoft, Anthropic et Google interviennent exclusivement comme prestataires techniques, sur instructions strictes de Doctolib, dans un cadre contractuel qui leur interdit d'utiliser les données à d'autres fins que la fourniture du service. En clair : les LLM américains sont bien mobilisés pour faire tourner les fonctionnalités de transcription et de synthèse, mais les notes médicales ne serviraient pas à affiner leurs poids. Sur le plan du stockage, Doctolib assure que les données sont hébergées sur des serveurs européens certifiés Hébergement de Données de Santé. Le Canard Enchaîné objecte toutefois que la justice américaine peut contraindre ces entreprises à transmettre des données outre-Atlantique, indépendamment de leur localisation physique. Cette controverse s'inscrit dans un débat plus large sur la souveraineté numérique des données de santé en France. Doctolib, qui traite des dizaines de millions de consultations, est une infrastructure critique du système de soins français, et toute ambiguïté sur le traitement de ses données sensitives déclenche une réaction immédiate. La tension entre innovation IA et protection des données médicales est structurelle : utiliser des LLM de pointe implique presque inévitablement de s'appuyer sur les infrastructures des géants américains, Microsoft, Google ou Anthropic, faute d'alternatives européennes comparables. Le RGPD et la certification HDS imposent des garanties, mais le Cloud Act américain crée un angle mort juridique que ni les certifications ni les contrats ne peuvent complètement combler. L'affaire illustre la fragilité des engagements de confidentialité dès lors que les données de santé transitent, même partiellement, par des acteurs soumis au droit américain.

UELes données médicales de millions de patients français transitent par des sous-traitants américains soumis au Cloud Act, créant une faille juridique structurelle que ni la certification HDS ni le RGPD ne peuvent entièrement combler.

💬 La distinction que fait Doctolib entre "faire tourner" et "entraîner" un LLM, elle est réelle. Mais ça n'enlève pas le truc qui gratte : tes comptes-rendus médicaux passent par des serveurs d'entreprises soumises au Cloud Act, et aucun label HDS ne te protège de ça. C'est une impasse structurelle, pas une faute de Doctolib spécifiquement.

ÉthiqueReglementation
1 source
Microsoft veut rendre les utilisateurs accros à son agent IA Scout
13Next INpact 

Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Microsoft a présenté Scout lors de sa conférence Build 2026, un agent IA autonome et permanent conçu pour s'intégrer profondément dans l'écosystème Microsoft 365. Contrairement à Copilot, qui répond à des sollicitations ponctuelles, Scout agit de manière proactive : il surveille Teams, Outlook, OneDrive, SharePoint, le calendrier et les e-mails pour anticiper les besoins de l'utilisateur. Concrètement, il peut repérer des réunions importantes, organiser automatiquement des rendez-vous, bloquer des créneaux dans l'agenda pour boucler un projet, préparer des documents avant une réunion ou signaler qu'une décision traîne et risque de faire déraper un planning. Scout possède aussi sa propre identité traçable : toutes ses actions sont journalisées et les opérations critiques nécessitent une validation humaine. Selon des documents internes publiés par 404media, plus de 1 000 employés Microsoft l'utilisent déjà, dont le PDG Satya Nadella. L'agent est pour l'instant en aperçu privé, mais le document interne révèle qu'il s'est imposé comme "l'un des outils internes les plus demandés chez Microsoft, sans annonce officielle, sans marketing". Cette approche représente un changement de paradigme dans l'usage professionnel de l'IA. Là où Copilot restait un assistant réactif, Scout ambitionne de devenir un collaborateur permanent qui apprend les habitudes de travail, identifie les projets prioritaires et anticipe les tâches récurrentes. Pour les entreprises clientes de Microsoft 365, cela signifie un agent qui réduit la charge cognitive des équipes en automatisant la coordination et la gestion du temps, deux des principaux goulots d'étranglement dans les organisations. L'enjeu commercial est considérable : Microsoft a investi des milliards dans ses infrastructures IA et cherche à transformer cet investissement en adoption massive au sein des entreprises. Ce qui rend le lancement de Scout particulièrement significatif, c'est la technologie qui le propulse : OpenClaw, une bibliothèque open source devenue une référence dans le monde des agents autonomes capables de manipuler des applications, des fichiers et des services en continu. Ironie du calendrier, Microsoft avertissait encore en février 2026 des risques de sécurité liés à OpenClaw, jugeant la technologie trop risquée pour les environnements d'entreprise en raison de ses privilèges étendus. L'éditeur a depuis changé de position et s'engage désormais à contribuer directement au projet, affirmant qu'il va "ajouter la sécurité, la gouvernance et l'intégration Microsoft 365" à la base existante. Ce revirement contraste avec l'approche de Meta, qui développe sa propre alternative propriétaire baptisée Hatch depuis qu'OpenAI a recruté Peter Steinberger, le créateur d'OpenClaw. Microsoft choisit l'intégration là où Meta choisit la bifurcation, un pari qui pourrait s'avérer décisif dans la course aux agents d'entreprise.

UEMicrosoft 365 étant massivement déployé dans les entreprises françaises et européennes, l'arrivée de Scout soulève des questions concrètes pour les DSI sur la gouvernance d'agents IA autonomes ayant accès aux données internes.

💬 En février, Microsoft nous expliquait qu'OpenClaw était trop dangereux pour les environnements d'entreprise. Quatre mois après, c'est la même techno qui fait tourner Scout en prod chez Satya Nadella, sans annonce officielle, juste des gens qui l'adoptent en interne. Ce revirement, ça en dit plus sur la pression concurrentielle que sur une vraie conviction technique.

OutilsOutil
1 source
Microsoft a désormais son propre modèle de raisonnement
14Next INpact 

Microsoft a désormais son propre modèle de raisonnement

Lors de sa conférence BUILD, Microsoft a dévoilé MAI-Thinking-1, son premier modèle de raisonnement maison, marquant une rupture significative dans la stratégie IA de l'entreprise. Ce modèle de type Mixture of Experts (MoE) embarque 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l'équivalent d'environ 600 pages. Sur les benchmarks mathématiques AIME 2025 et 2026, il atteint respectivement 97 % et 94,5 %. Microsoft affirme qu'il égale Claude Opus 4.6 sur SWE-Bench Pro, un benchmark de codage, et qu'il a été préféré à Claude Sonnet 4.6 dans des évaluations indépendantes en aveugle conduites par Surge. CNBC rapporte même une démonstration affichant des résultats supérieurs à GPT-5.5 d'OpenAI, avec un coût dix fois inférieur sur des données McKinsey. Le modèle est actuellement en préversion privée via Microsoft Foundry, intégré à GitHub Copilot Enterprise, avec une version pour Azure Confidential Computing annoncée. La famille MAI s'enrichit également de six autres modèles : MAI-Image-2.5 et sa variante Flash pour la génération d'images (déployés dans PowerPoint et OneDrive), et MAI-Transcribe-1.5, présenté comme le meilleur modèle de transcription au monde. Jusqu'à présent, Microsoft occupait surtout le rôle de distributeur de modèles tiers, OpenAI via Copilot, Anthropic via ses assistants, sans disposer de sa propre capacité de raisonnement avancée. L'émergence de MAI-Thinking-1 change fondamentalement cette donne. Pour les entreprises utilisant Azure et GitHub Copilot Enterprise, cela signifie un accès à un modèle de raisonnement compétitif sans dépendre d'un fournisseur externe. Le fait que Microsoft insiste sur un entraînement "from scratch" à partir de données commercialement licenciées, sans distillation depuis d'autres modèles, est aussi un argument juridique et commercial fort pour les clients soucieux de conformité et de propriété intellectuelle. Ce pivot s'explique par une évolution du paysage des alliances. OpenAI, dans lequel Microsoft a investi plusieurs milliards de dollars, suit désormais sa propre trajectoire de manière nettement plus autonome. Anthropic, de son côté, a considérablement gagné en influence, notamment dans les usages développeurs. Pour Redmond, rester dans une position de simple relais devenait stratégiquement risqué. En développant sa propre gamme MAI, Microsoft affirme une indépendance technologique qui lui permet de négocier différemment avec ses partenaires LLM tout en proposant une offre intégrée de bout en bout. La prochaine étape sera la disponibilité générale du modèle et la publication de sa tarification complète sur les tokens de raisonnement, deux inconnues qui détermineront son adoption réelle face à des concurrents déjà bien établis.

UELes entreprises européennes utilisant Azure ou GitHub Copilot Enterprise pourront accéder à un modèle de raisonnement compétitif entraîné sur données commercialement licenciées, un argument de conformité pertinent face aux exigences de l'AI Act et du RGPD.

💬 Microsoft en simple distributeur d'OpenAI et d'Anthropic, ça ne pouvait pas durer. MAI-Thinking-1, c'est leur sortie de cette dépendance, et vu la trajectoire d'OpenAI ces derniers mois, on comprend le timing. Les benchmarks sont convaincants sur le papier (97% sur AIME, parité avec Claude Opus sur SWE-Bench), mais le vrai test, c'est la tarification complète et la sortie de preview.

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D
15AI News 

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D

Microsoft a dévoilé cette semaine le processeur quantique Majorana 2, accompagné de chiffres qui redéfinissent les standards du secteur : des qubits mille fois plus fiables que ceux de la première génération, une durée de vie moyenne de 20 secondes contre quelques microsecondes pour les puces concurrentes, et un objectif de calculateur quantique commercialement utilisable d'ici 2029. Le changement clé à l'origine de ce bond : le remplacement du matériau supraconducteur, passant de l'aluminium au plomb, une décision issue d'années de recherche conventionnelle en science des matériaux. En parallèle, Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme d'IA agentique dédiée à la R&D scientifique, dont le développement de Majorana 2 constitue la première démonstration publique d'efficacité. Ce qui rend cette annonce structurellement importante, ce n'est pas que l'IA ait conçu la puce, mais ce qu'elle a rendu possible autour de la recherche humaine. Microsoft Discovery n'a pas choisi le plomb comme matériau, mais ses agents ont pris en charge la gestion des flux de fabrication, l'automatisation de mesures qui prenaient auparavant plusieurs semaines chacune, et surtout la synthèse de près de vingt ans de données de recherche cloisonnées. Zulfi Alam, vice-président corporate de Microsoft pour le quantum, résume : "Les agents IA peuvent recréer des corrélations que nous, en tant qu'humains, ne pouvons pas voir, parce qu'aucun individu n'a cette vision sur autant de données." Concrètement, la détection des états quantiques sur des fils semi-conducteurs, un processus manuel qui s'étalait sur des semaines, est désormais automatisée en continu par un agent spécialisé capable d'ajuster simultanément des centaines de paramètres de tension, là où un chercheur raisonne nécessairement de façon linéaire. La course à l'informatique quantique fiable oppose depuis des années Microsoft, Google, IBM et quelques startups comme IonQ ou PsiQuantum, chacun misant sur des architectures radicalement différentes. Microsoft a longtemps été en retrait sur les résultats concrets, pariant sur les qubits topologiques basés sur les fermions de Majorana, une approche théoriquement plus robuste mais expérimentalement très difficile à réaliser. Majorana 2 marque un tournant crédible dans cette stratégie. Mais l'enjeu dépasse le quantum : avec la mise en disponibilité générale de Microsoft Discovery pour les entreprises, incluant des agents spécialisés, un moteur de raisonnement et une gouvernance de niveau entreprise, Microsoft positionne l'IA agentique comme infrastructure centrale de la R&D industrielle. Si la preuve par la puce quantique tient ses promesses, d'autres secteurs, pharmaceutique, matériaux, énergie, pourraient rapidement adopter ce modèle où l'IA compresse les cycles expérimentaux et libère les chercheurs des tâches de mesure et de synthèse de données.

UELes entreprises européennes des secteurs pharmaceutique, des matériaux et de l'énergie peuvent désormais accéder à Microsoft Discovery en disponibilité générale pour accélérer leurs cycles de R&D.

💬 Ce qui m'intéresse dans cette annonce, c'est pas la puce, c'est ce que Discovery a rendu possible autour : 20 ans de données de recherche cloisonnées synthétisées, des mesures qui prenaient des semaines automatisées en continu par des agents. L'IA n'a pas choisi le plomb comme matériau, c'est des années de science des matériaux classique qui ont mené là. Reste à voir si ça tient hors labo, mais le pharma et l'énergie ont de bonnes raisons de regarder ça de très près.

InfrastructureOpinion
1 source
Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI
16Latent Space 

Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI

Lors de la conférence Microsoft Build des 1er et 2 juin 2026, Satya Nadella et Mustafa Suleyman ont annoncé le lancement de sept nouveaux modèles d'intelligence artificielle sous la bannière MAI, la division IA interne de Microsoft. La famille comprend MAI-Thinking-1, le modèle phare de raisonnement, ainsi que MAI-Code-1-Flash pour la génération de code, MAI-Image-2.5 pour la vision, MAI-Transcribe-1.5 pour la transcription vocale et MAI-Voice-2 pour la synthèse vocale. MAI-Thinking-1 est une architecture MoE (Mixture of Experts) de 35 milliards de paramètres actifs, avec une fenêtre de contexte de 256 000 tokens, pré-entraîné sur 30 000 milliards de tokens grâce à 8 192 GPU GB200. Le modèle atteint 97 % sur le benchmark AIME 2025 et 53 % sur SWE-Bench Pro. Microsoft a également publié un rapport technique de 109 pages détaillant son architecture, saluée par la communauté de recherche pour son niveau de transparence inhabituel. Ces annonces marquent une étape significative pour Microsoft, qui se positionne désormais non plus seulement comme plateforme IA mais comme laboratoire de frontier models à part entière. Le fait que MAI-Thinking-1 ait été entraîné sans distillation à partir de modèles tiers, contrairement à de nombreux modèles concurrents, lui confère une crédibilité technique particulière. Des évaluateurs humains indépendants sur la plateforme Surge ont préféré ce modèle à Claude Sonnet 4.6 d'Anthropic dans des tests en aveugle. Pour les entreprises, cette offre ouvre la voie à des fine-tuning spécialisés dans des domaines précis, un créneau que les laboratoires frontier comme OpenAI ou Google ont progressivement abandonné. L'annonce de Web IQ, une nouvelle couche API de recherche et d'ancrage pour agents IA que Microsoft revendique déjà au cœur de "presque tous les agents et chatbots de l'industrie, y compris Copilot et ChatGPT", renforce cette ambition de devenir l'infrastructure invisible de l'IA d'entreprise. Microsoft AI, anciennement connue sous le nom d'Inflection AI après son rachat en 2024, n'existe que depuis deux ans sous cette forme. Le fait qu'elle produise des modèles entraînés de zéro à ce niveau de performance illustre la rapidité de montée en puissance possible avec des ressources computationnelles massives. Build 2026 a également mis en avant GitHub Copilot repositionné comme environnement de développement natif pour agents, une nouvelle Surface RTX Spark Dev Box, et des projets hardware conceptuels comme Solara et Scout. Mustafa Suleyman a décrit Microsoft comme une "machine à escalader des collines", ce qui traduit une stratégie d'amélioration continue et méthodique plutôt que des percées spectaculaires. La prochaine étape sera de voir si MAI-Thinking-1 tient ses promesses dans des déploiements réels, et si Microsoft parvient à convaincre l'écosystème de développeurs de s'appuyer sur ses modèles plutôt que ceux d'OpenAI, dont il reste paradoxalement l'un des principaux investisseurs.

UELes entreprises européennes sur Azure peuvent accéder aux modèles MAI et à l'API Web IQ pour leurs agents IA, réduisant potentiellement leur dépendance aux modèles OpenAI.

💬 MAI-Thinking-1 entraîné de zéro, sans distillation depuis OpenAI ou quiconque, c'est la vraie nouveauté de Build 2026. Ça donne une crédibilité technique que peu s'attendaient à voir en deux ans d'existence. Reste à savoir si les devs vont faire confiance aux MAI plutôt qu'à OpenAI, sachant que Microsoft finance les deux en même temps.

LLMsOpinion
1 source
OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises
17The Information AI 

OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises

Le même mardi, OpenAI et Microsoft ont chacun organisé un événement dédié aux entreprises, dans deux villes différentes. OpenAI a tenu une présentation à New York pour promouvoir de nouveaux outils d'intelligence artificielle à destination des professionnels, dont plusieurs conçus pour des secteurs précis comme le trading d'actions et la banque d'investissement. En parallèle, Microsoft tenait son propre événement à San Francisco, où l'entreprise a dévoilé du nouveau matériel informatique spécifiquement pensé pour l'IA, notamment un ordinateur de bureau et des modèles d'IA destinés aux entreprises clientes. Ces annonces simultanées illustrent la pression croissante que subissent les responsables des achats technologiques dans les grandes entreprises. La multiplication des offres d'IA entreprise rend les décisions d'achat de plus en plus complexes : chaque acteur majeur du secteur déploie désormais des équipes de consultants, souvent rebaptisés "forward-deployed engineers", pour convaincre les directions informatiques d'adopter leurs solutions. Pour OpenAI, dont le modèle économique repose largement sur les contrats d'entreprise, s'imposer sur ce segment est devenu une priorité stratégique et financière majeure. Le marché de l'IA en entreprise est aujourd'hui perçu comme un terrain sur lequel Anthropic, concurrent direct d'OpenAI, jouit d'une longueur d'avance et d'une image particulièrement solide auprès des directions techniques et des grands comptes. Microsoft, actionnaire historique d'OpenAI et partenaire de longue date des entreprises via Azure et la suite Office, occupe quant à lui une position établie dans cet écosystème. L'offensive conjointe des deux alliés témoigne néanmoins de l'intensification de la bataille pour capter les budgets informatiques des grandes organisations, à mesure que l'IA générative passe du stade expérimental à celui de l'outil opérationnel intégré dans les processus métier.

UELes entreprises européennes devront arbitrer entre les offres concurrentes d'OpenAI et Microsoft pour leurs budgets IA, avec une complexité croissante des décisions d'achat technologique à mesure que l'IA générative s'intègre dans les processus métier.

💬 Deux événements le même jour, deux villes différentes : OpenAI et Microsoft ne laissent plus rien au hasard sur le segment entreprise. Le signal, c'est qu'ils sentent tous les deux la pression d'Anthropic, qui s'est imposé chez les équipes techniques sans avoir eu besoin de tout ce cirque commercial. Reste à voir si les "forward-deployed engineers" suffisent à renverser ça.

Scout : le nouveau OpenClaw de Microsoft qui automatise tout
18Le Big Data 

Scout : le nouveau OpenClaw de Microsoft qui automatise tout

Microsoft a présenté Scout lors de sa conférence Build 2026, un nouvel assistant IA autonome intégré directement dans l'environnement Microsoft 365. Conçu pour aller bien au-delà du chatbot classique, Scout peut accéder aux e-mails, calendriers et services Microsoft afin d'exécuter des tâches automatiquement : organiser des réunions, préparer des ordres du jour, gérer des tâches administratives courantes. L'outil est actuellement disponible via le programme Frontier de Microsoft, mais nécessite un abonnement GitHub Copilot pour y accéder. Contrairement aux assistants ponctuels, Scout apprend les habitudes de travail de chaque utilisateur au fil du temps : il est personnalisable, peut recevoir un prénom choisi par l'utilisateur, et s'ajuste selon les retours réguliers qu'on lui transmet. Les utilisateurs pourront également créer leurs propres compétences et scénarios d'automatisation pour l'adapter à des besoins métier très spécifiques. L'enjeu pour Microsoft est considérable. Avec des centaines de millions de professionnels qui utilisent quotidiennement la suite Microsoft 365, intégrer un agent capable d'anticiper les besoins et d'agir sans attendre d'instruction représente un changement de paradigme dans la productivité au bureau. Ce n'est plus l'assistant qui répond aux questions, mais celui qui prend des initiatives : surveiller un calendrier surchargé, détecter un conflit de planning, préparer un briefing avant une réunion. Pour les entreprises, les gains de temps potentiels sont réels, mais la question du contrôle se pose immédiatement. Microsoft affirme avoir intégré plusieurs mécanismes de sécurité : un système de vérification continue du respect des règles définies par l'utilisateur et l'organisation, ainsi qu'un journal d'audit enregistrant chaque action significative. Plus un agent gagne en autonomie, plus les conséquences d'une erreur peuvent être lourdes, ce qui rend ces garde-fous essentiels à la crédibilité du produit. Scout s'inscrit dans une tendance de fond qui s'est accélérée depuis le début 2026, portée notamment par OpenClaw, le projet qui a popularisé l'idée d'agents IA agissant de manière vraiment autonome sans attendre d'instructions humaines explicites. Microsoft reprend explicitement cette architecture conceptuelle et l'adapte à son écosystème propriétaire, une stratégie déjà utilisée avec succès pour GitHub Copilot. La bataille dans l'industrie IA ne porte plus sur les chatbots les plus fluides, mais sur les agents les plus capables d'agir dans le monde réel. Google, Amazon et des dizaines de startups travaillent sur des approches similaires. Ce que Scout tente de résoudre, c'est le problème de la confiance : convaincre les utilisateurs professionnels de déléguer une partie de leur organisation quotidienne à un système automatisé, avec suffisamment de transparence et de contrôle pour que cette délégation soit acceptable.

UEL'intégration d'agents autonomes accédant aux e-mails et calendriers dans Microsoft 365, suite utilisée par des millions de professionnels européens, soulève des questions concrètes de conformité RGPD pour les entreprises françaises et européennes.

💬 C'est le genre de truc qu'on attendait depuis deux ans. Microsoft reprend l'idée des agents autonomes, l'ancre dans 365 où les données sont déjà là, et du coup ça tient mieux que les démos sur terminal vide qu'on nous sert depuis 2024. Reste que laisser un agent gérer tes mails et ton calendrier, ça demande un niveau de confiance que la plupart des boîtes françaises ne sont pas encore prêtes à accorder.

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud
19NVIDIA AI Blog 

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

NVIDIA et Microsoft ont dévoilé lors de Microsoft Build un partenariat élargi pour déployer une pile technologique unifiée dédiée à l'IA agentique, couvrant les PC Windows, le cloud Azure et les environnements locaux. Jensen Huang, fondateur et PDG de NVIDIA, est intervenu en direct depuis Taipei aux côtés de Satya Nadella pour présenter les nouvelles initiatives. Au programme : les PC RTX Spark et les stations DGX Station for Windows, l'accélération GPU de Microsoft Fabric, les modèles ouverts NVIDIA sur Microsoft Foundry, et le runtime sécurisé NVIDIA OpenShell intégré à GitHub Copilot. RTX Spark cible les laptops et petits ordinateurs de bureau avec 1 pétaflop de performance IA, jusqu'à 128 Go de mémoire unifiée et une autonomie toute la journée, avec des systèmes attendus cet automne chez Microsoft Surface, ASUS, Dell, HP, Lenovo et MSI. La DGX Station for Windows, propulsée par le superchip NVIDIA GB300 Grace Blackwell Ultra, offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops en FP4, capable de faire tourner des modèles jusqu'à 1 billion de paramètres, avec des livraisons prévues au quatrième trimestre 2026 chez ASUS, Dell, GIGABYTE, HP, MSI et Supermicro. Ce partenariat marque un tournant dans la course à l'IA agentique d'entreprise en proposant, pour la première fois, une chaîne complète allant du matériel personnel à l'infrastructure cloud. Pour les développeurs et les entreprises, cela signifie pouvoir construire, affiner et déployer des agents IA directement sur Windows sans dépendre exclusivement du cloud. Les modèles Claude d'Anthropic tournent désormais nativement sur les systèmes Blackwell Ultra dans Azure, avec une disponibilité annoncée dans les prochaines semaines. Sur Microsoft Foundry, le nouveau NVIDIA Nemotron 3 Ultra, conçu pour le raisonnement de longue durée dans des tâches de codage, de recherche et de workflows d'entreprise, est disponible dès ce mois-ci, accompagné de Nemotron 3.5 ASR pour la reconnaissance vocale et Nemotron 3.5 Content Safety pour la modération de contenu. Ce rapprochement intervient alors que l'ensemble de l'industrie cherche à concrétiser la promesse des agents IA autonomes capables d'exécuter des tâches complexes sur la durée. NVIDIA, dont les GPU sont devenus incontournables dans les data centers, étend son influence jusqu'au bureau et au PC personnel, concurrençant indirectement Apple Silicon et AMD sur le terrain de l'inférence locale. Le runtime OpenShell, sécurisé nativement, répond aux exigences de gouvernance des grandes entreprises qui hésitent encore à confier des tâches autonomes à des agents. L'intégration des bibliothèques CUDA-X comme cuDF, cuOpt et NeMo directement accessibles aux agents ouvre la voie à des workflows scientifiques plus complexes, notamment avec le modèle Cosmos 3 pour la simulation du monde physique et les modèles météo Earth-2 disponibles via Microsoft Planetary Computer Pro.

UELes entreprises européennes utilisant Azure et Windows bénéficieront d'une chaîne de déploiement IA unifiée du PC personnel au cloud, réduisant la dépendance exclusive à l'infrastructure cloud pour les workflows agentiques.

💬 Jensen Huang qui s'invite en hologramme depuis Taipei pendant le keynote de Satya, c'est le genre de mise en scène qui cache souvent un partenariat creux. Là, non : la DGX Station sous Windows avec 748 Go de mémoire cohérente et 20 pétaflops, c'est du concret pour les boîtes qui refusent de tout mettre dans Azure. Reste à voir si les prix seront accessibles à autre chose qu'aux grands comptes, mais l'idée d'une chaîne complète du laptop au datacenter sans changer de stack, ça change vraiment quelque chose pour les équipes qui font tourner des agents en prod.

InfrastructureActu
1 source
Microsoft dévoile sept modèles d’IA maison pour s’émanciper d’OpenAI et partir chasser sur les terres d’Anthropic et de Google
20Frandroid 

Microsoft dévoile sept modèles d’IA maison pour s’émanciper d’OpenAI et partir chasser sur les terres d’Anthropic et de Google

Lors de sa conférence Build, Microsoft a annoncé le lancement de sept modèles d'intelligence artificielle développés entièrement en interne, marquant une rupture stratégique significative avec sa dépendance historique à OpenAI. Cette famille de modèles maison, dévoilée devant les développeurs et partenaires de l'entreprise, couvre différentes tailles et usages, des modèles légers optimisés pour les appareils locaux aux versions plus puissantes destinées au cloud Azure. Microsoft positionne explicitement ces modèles face à Claude d'Anthropic et aux modèles Gemini de Google. Ce pivot vers l'autonomie technologique représente un changement profond pour les entreprises clientes de Microsoft, qui disposent désormais d'une alternative aux modèles OpenAI au sein même de l'écosystème Azure et Copilot. Pour les développeurs, cela signifie plus de choix, potentiellement des coûts différents et une moindre exposition aux aléas de la relation Microsoft-OpenAI. Pour l'industrie, c'est la confirmation que les grands éditeurs tech ne veulent plus sous-traiter le cerveau de leurs produits IA. Ce mouvement s'inscrit dans une tension croissante entre Microsoft et OpenAI, deux entités liées par un partenariat de plusieurs milliards de dollars mais dont les intérêts divergent à mesure qu'OpenAI se rapproche d'une structure commerciale indépendante. En bâtissant sa propre capacité de modélisation, Microsoft réduit sa vulnérabilité stratégique et entre directement en compétition avec les laboratoires qu'elle finançait indirectement. La guerre des modèles fondamentaux se joue désormais aussi dans les couloirs de Redmond.

UELes entreprises et développeurs européens utilisant Azure et Copilot disposent désormais d'alternatives aux modèles OpenAI, avec des implications potentielles sur les coûts et la dépendance stratégique au sein de l'écosystème Microsoft.

💬 C'est le genre de move qu'on voyait venir depuis que la relation Microsoft-OpenAI a commencé à craquer en public. Sept modèles d'un coup, du léger pour les appareils locaux au costaud pour Azure, ça ressemble moins à une annonce produit qu'à une déclaration d'indépendance. Bon, faut encore que ces modèles tiennent la route, parce que s'attaquer frontalement à Claude et Gemini, c'est pas anodin.

LLMsOpinion
1 source
Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin
21VentureBeat AI 

Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin

Microsoft a présenté lors de sa conférence Build 2026 deux nouvelles solutions destinées à résoudre un problème croissant dans les entreprises : la prolifération des silos de données générés par les agents IA. La première, Microsoft IQ, étend Fabric IQ en une couche de contexte unifiée regroupant quatre sources d'information distinctes : Work IQ (emails, réunions, flux de travail internes), Foundry IQ (bases de connaissances et procédures institutionnelles), Fabric IQ (état opérationnel en temps réel via Fabric Real-Time Intelligence), et Web IQ (signaux en provenance du web public). La seconde, Rayfin, est un SDK et CLI open-source qui déploie les applications générées par des agents directement dans Microsoft Fabric, acheminant automatiquement leurs données vers Microsoft OneLake plutôt que vers des backends isolés. Ces annonces interviennent dans un contexte révélateur : selon le VB Pulse Q1 2026 RAG Infrastructure Market Tracker, la proportion d'organisations de plus de 100 employés utilisant une approche hybride de récupération d'information a triplé entre janvier et mars 2026, passant de 10,3 % à 33,3 %. L'enjeu est considérable pour les équipes techniques et les directions des systèmes d'information. Chaque nouvel agent IA déployé repart aujourd'hui de zéro, sans mémoire du fonctionnement de l'organisation, des règles métier applicables ou de l'emplacement des données. Microsoft IQ vise à éliminer ce problème en offrant un point d'accès unique à l'ensemble du contexte organisationnel, qu'un développeur peut connecter en une seule étape d'intégration. De son côté, Rayfin s'attaque à l'autre versant du problème : les outils de développement assistés par IA génèrent des applications à un rythme que les équipes data ne peuvent plus gouverner, chacune créant par défaut un nouveau silo. Microsoft positionne explicitement Rayfin contre Supabase et Neon, les backends compatibles Postgres que ces outils utilisent spontanément, en substituant à ces solutions une infrastructure soumise aux politiques de conformité de Fabric. Cette double offensive s'inscrit dans une compétition acharnée entre les grands acteurs des plateformes de données d'entreprise, tous engagés dans la même course vers une couche de contexte partagée pour agents. Amir Netz, directeur technique de Microsoft Fabric, résume l'ambition avec une métaphore : comme l'écran vert de Matrix construisait la réalité dans laquelle évoluaient les agents du film, la plateforme data doit désormais "créer la réalité pour les agents à partir des données". La relation entre Rayfin et Microsoft IQ est présentée comme bidirectionnelle : un agent construit une application en puisant dans l'ontologie organisationnelle, et les données produites par cette application viennent enrichir l'ontologie pour les agents suivants. Les ontologies de Fabric IQ sont attendues en disponibilité générale dans les prochains mois, et l'exécution réelle de cette vision reste encore à démontrer à l'échelle.

UELes entreprises européennes utilisant Microsoft Fabric devront évaluer la conformité de ces nouvelles architectures de données centralisées avec le RGPD avant tout déploiement à grande échelle.

OutilsOpinion
1 source
Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord
22VentureBeat AI 

Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord

Microsoft a présenté mardi, lors de sa conférence annuelle Build, une nouvelle couche de sécurité intégrée directement dans Windows : les Microsoft Execution Containers, ou MXC. Il ne s'agit pas d'un produit à acheter, mais d'un SDK et d'un modèle de politique embarqués dans le système d'exploitation et dans le Windows Subsystem for Linux. Concrètement, MXC permet aux développeurs et aux administrateurs informatiques de définir précisément ce qu'un agent IA peut ou ne peut pas faire, avec des limites appliquées en temps réel par le noyau du système. Le dispositif couvre un spectre allant de l'isolation légère de processus, déjà adoptée par la CLI de GitHub Copilot, jusqu'aux micro-machines virtuelles, conteneurs Linux et instances cloud tournant sous Windows 365. Chaque agent est lié à une identité forte, locale ou provisionnée via Microsoft Entra, ce qui permet d'attribuer, d'auditer et de gouverner chacune de ses actions. OpenAI et Nvidia font partie des premiers partenaires annoncés. L'annonce intervient à un moment charnière pour les entreprises. Jusqu'à présent, le déploiement d'agents IA autonomes sur des réseaux d'entreprise se heurtait à un paradoxe : plus un agent est capable, plus il est dangereux à laisser opérer sans garde-fous. MXC sépare l'exécution de l'agent du bureau de l'utilisateur, du presse-papiers, de l'interface graphique et des périphériques d'entrée, ce qui réduit drastiquement la surface d'attaque. Pour les directions informatiques et sécurité, c'est potentiellement le verrou qui empêchait de passer des démos à la production réelle : un environnement d'exécution de confiance, standardisé et intégré à l'OS, plutôt qu'une solution maison bricolée par chaque éditeur. Depuis deux ans, les chercheurs en sécurité ont multiplié les démonstrations montrant comment des agents IA pouvaient être manipulés par injection de prompt, appels d'outils malveillants ou exfiltration de données dissimulée dans des flux de travail normaux. Microsoft elle-même décrit le problème comme "un enjeu systémique multi-couches" : chaque interaction entre un agent et des humains, des outils, des applications ou d'autres agents ouvre de nouvelles failles. En intégrant MXC directement dans Windows plutôt qu'en le proposant comme une surcouche optionnelle, Microsoft cherche à établir un standard de facto pour l'industrie. Si les grands éditeurs de logiciels d'entreprise adoptent ce modèle, ce sont potentiellement toutes les entreprises du monde utilisant Windows qui bénéficieront automatiquement de ce cadre de sécurité pour leurs déploiements d'agents, sans action supplémentaire.

UELes entreprises françaises et européennes utilisant Windows pourraient bénéficier automatiquement de ce cadre d'exécution sécurisé pour leurs déploiements d'agents IA, sans développement de solution maison.

💬 C'est le verrou qui manquait pour passer des démos à la prod. On a tous vu des agents autonomes tourner en sandbox, faire des trucs impressionnants, et tout le monde savait qu'on ne pourrait jamais les laisser opérer sur un vrai réseau sans cage solide. Intégrer ça dans le noyau Windows plutôt qu'en surcouche optionnelle, c'est la seule façon d'en faire un standard, même si ça revient à confier les clés de la gouvernance IA mondiale à Redmond.

SécuritéOpinion
1 source
IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA
23Le Big Data 

IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA

Snowflake et Anthropic ont annoncé le 2 juin 2026, lors du Snowflake Summit 2026, un renforcement significatif de leur partenariat autour de l'IA d'entreprise. Concrètement, les modèles Claude d'Anthropic s'intègrent désormais plus profondément dans Snowflake Cortex AI, notamment pour alimenter Snowflake Cortex Code et Snowflake Intelligence. L'objectif est de permettre aux organisations de déployer des agents IA directement dans leur environnement de données existant, sans avoir à externaliser ou déplacer des données sensibles. Des entreprises comme Block, Indeed, Carvana, Notion ou eSentire utilisent déjà cette combinaison en production. Christian Kleinerman, EVP Product chez Snowflake, a indiqué que Snowflake Cortex Code serait devenu le produit à la croissance la plus rapide de toute l'histoire du groupe. L'enjeu central de ce partenariat est la gouvernance : les entreprises des secteurs réglementés, finance, santé, cybersécurité, retail, ne peuvent pas déployer l'IA sur des données critiques sans garanties fortes en matière de sécurité, de conformité et de traçabilité. En combinant la couche de gouvernance et de contrôle d'accès de Snowflake avec les capacités de raisonnement de Claude, les deux groupes proposent une architecture où le modèle devient une extension native de la plateforme data de l'entreprise plutôt qu'un outil externe. Cela change concrètement le profil de risque de l'IA générative pour les décideurs : Block automatise ainsi des workflows de conformité pour Square et Cash App, eSentire automatise des analyses SOC de niveau 1 pour libérer ses analystes humains des tâches répétitives, et Carvana optimise ses opérations logistiques et financières grâce à cette architecture. Ce renforcement s'inscrit dans la continuité d'un accord élargi signé fin 2025, qui avait déjà permis l'intégration native de Claude dans Cortex AI sur les principaux clouds. Le marché de l'IA d'entreprise est en train de basculer d'une phase d'expérimentation vers des déploiements opérationnels à grande échelle, et plusieurs acteurs, Microsoft avec Azure OpenAI, Google avec Vertex AI, AWS avec Bedrock, se livrent une concurrence intense pour capter cette demande. Snowflake, en tant que plateforme data indépendante du cloud, joue une carte différente : celle de la neutralité et de la gouvernance centralisée. Anthropic, de son côté, accélère sa distribution en entreprise via des partenariats stratégiques plutôt que par une offre cloud propriétaire. Les prochaines étapes du partenariat devraient porter sur l'extension de Claude Marketplace au sein de l'écosystème Snowflake, ouvrant la porte à un modèle de distribution plus large pour les modèles d'Anthropic dans les environnements data d'entreprise.

UELes entreprises européennes des secteurs réglementés (finance, santé, cybersécurité) disposent d'une architecture permettant de déployer Claude directement dans leur environnement de données existant, sans externaliser de données sensibles, un argument clé pour la conformité RGPD.

OutilsOpinion
1 source
Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs
24Next INpact 

Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

Le 1er juin 2026, GitHub a basculé son service Copilot vers un système de facturation entièrement basé sur l'usage réel, mettant fin à l'accès illimité aux modèles moins puissants dont bénéficiaient jusqu'alors les abonnés. Désormais, chaque formule est assortie d'une enveloppe de "crédits IA" qui se consomme proportionnellement au modèle choisi et au volume de tokens traités, quelle que soit la puissance du modèle. Les retours des premiers utilisateurs sont sans appel : un développeur abonné à Copilot Pro+ à 39 dollars par mois a épuisé 8 % de ses crédits mensuels en deux heures de travail ; un autre a vu sa première requête du jour engloutir 18 % de son quota, pour une tâche de découpe d'un fichier JavaScript de 1 500 lignes. Un troisième signale avoir dépensé 270 tokens, soit 18 % de sa limite Pro, pour remplacer un simple code de vérification par e-mail par un lien de réinitialisation direct. Ce changement représente un véritable choc psychologique et économique pour une large frange de développeurs professionnels. L'ancien modèle garantissait une prévisibilité budgétaire : l'abonnement mensuel couvrait un usage quotidien intensif sur les modèles standards. La nouvelle mécanique introduit une dimension d'anxiété permanente, chaque interaction devenant une dépense à surveiller. Plusieurs utilisateurs évoquent une dégradation directe de leur productivité : la crainte de "brûler" ses crédits pousse à s'autocensurer sur des requêtes complexes, ce qui contredit l'intérêt même de l'outil. Sur Reddit et sur le forum officiel de GitHub, les témoignages d'abonnés estimant le rythme de consommation "insoutenable" se multiplient, bien que certains nuancent en soulignant que les cas extrêmes correspondent souvent à des sessions particulièrement intensives. Ce pivot tarifaire s'inscrit dans une tendance plus large du secteur, où les éditeurs cherchent à aligner leurs revenus sur la consommation réelle de ressources LLM, dont les coûts d'inférence varient considérablement selon les modèles. Microsoft avait annoncé la transition fin avril, laissant un mois aux utilisateurs pour s'y préparer, mais la réalité du terrain révèle un écart important entre les estimations théoriques et l'usage effectif. La disponibilité de modèles très puissants comme Opus 4.8 ou GPT-5.5 directement dans l'interface amplifie le phénomène : des développeurs optent pour ces modèles par défaut sans mesurer l'impact sur leurs crédits. La pression des utilisateurs pourrait contraindre GitHub à ajuster ses paliers tarifaires ou à introduire des alertes de consommation, mais pour l'instant, le service reste tel quel au lendemain du basculement.

UELes développeurs français et européens abonnés à GitHub Copilot doivent revoir leur usage et leur budget face à ce nouveau modèle de crédits, qui réduit la prévisibilité des coûts pour un outil central dans de nombreuses équipes tech.

💬 Honnêtement, c'est plus intéressant que ça en a l'air. Mais bon, sur le papier... GitHub Copilot, c'est bien beau l'IA qui code pour toi, mais voilà qu'ils passent à une facturation basée sur l'usage réel. Tu fais deux heures de boulot et hop, 8% de ton quota, tu te retrouves à compter les tokens comme un fou. C'est le genre de truc qu'on attendait depuis 2 ans, mais maintenant c'est là, et ça fait mal. La peur de "brûler" ses crédits, ça vous cloue au sol, tu te censures sur les requêtes complexes, c'est pas le but d'un outil comme Copilot. Les utilisateurs sont en train de dire que le rythme de consommation est insoutenable, et je comprends pourquoi. Microsoft a annoncé la transition, mais entre les estimations théoriques et l'usage réel, il y a un fossé énorme. Les développeurs se jettent sur les modèles puissants comme Opus ou GPT sans vraiment se poser la question de l'impact sur leur budget. GitHub va-t-il ajuster ses tarifs ou introduire des alertes ? À voir, mais pour l'instant, c'est un nouveau stress pour les dévs français et européens qui comptent sur Copilot.

GitHub Copilot augmente ses prix selon la consommation de tokens
25AI News 

GitHub Copilot augmente ses prix selon la consommation de tokens

Depuis le 1er juin 2026, GitHub Copilot a basculé vers un système de facturation à la consommation de tokens, remplaçant l'accès illimité aux modèles d'IA inclus dans les abonnements mensuels. Les tarifs d'abonnement restent inchangés, Copilot Pro à 10 dollars par mois, Pro+ à 39 dollars, Business à 19 dollars par utilisateur, Enterprise à 39 dollars, mais ils définissent désormais un nombre de crédits mensuels, et non plus un accès illimité. Un utilisateur Enterprise dispose ainsi de 3 900 crédits, un utilisateur Business de 1 900. Ces crédits se consomment en tokens selon le modèle choisi : avec GPT-5.2 par exemple, les tokens en entrée coûtent 1,75 dollar par million, les tokens en sortie 14 dollars par million. Les complétions de code dans l'éditeur et les suggestions "next edit" restent gratuites, mais toutes les autres fonctionnalités, y compris la revue de code, sont désormais décomptées. Le changement a provoqué une vague de réactions sur le forum GitHub Community Discussions dès le lendemain de l'entrée en vigueur. Plusieurs utilisateurs signalent un épuisement rapide et inattendu de leurs crédits. L'un d'eux, "rvs99", rapporte avoir dépensé environ 0,35 dollar par ligne modifiée sur une tâche mineure avec Claude Sonnet 4.6. Un autre, "prhost", montre qu'après une seule journée de travail, il ne lui reste que 3 705 crédits sur une allocation de 7 000, concluant que Microsoft "s'est tiré une balle dans le pied". La frustration est réelle : des équipes entières voient leur budget LLM exploser sans avoir modifié leurs habitudes de travail, simplement parce que la transparence sur les coûts réels était absente des offres initiales. La transition était pourtant prévisible. Microsoft avait annoncé ce changement de modèle dès avril 2026, et les abonnements à tarif fixe avec accès illimité aux LLMs constituaient clairement des offres d'appel, destinées à ancrer GitHub Copilot comme outil standard dans les équipes de développement. Faire tourner des modèles de langage à grande échelle est coûteux, entre l'infrastructure GPU, le post-entraînement, la maintenance et la construction de nouveaux datacenters. La facturation au token aligne désormais les recettes de GitHub sur les coûts réels de la plateforme. Pour les entreprises, l'équation change : les directions techniques devront soit encadrer strictement l'usage des modèles les plus puissants, soit réévaluer leur dépendance à Copilot face à des alternatives comme Cursor ou des solutions auto-hébergées. Ce virage tarifaire de Microsoft pourrait accélérer une rationalisation plus large du marché des assistants de code.

UELes équipes de développement françaises et européennes utilisant GitHub Copilot doivent revoir leurs budgets LLM et envisager des alternatives auto-hébergées ou des outils concurrents, car leurs coûts réels pourraient exploser sans modification de leurs habitudes de travail.

💬 C'était écrit depuis le début : l'accès illimité pour 10 dollars par mois, c'était du prix d'appel pour t'ancrer dans l'outil. Maintenant que la dépendance est bien installée, Microsoft présente l'addition, et les chiffres sont saignants (0,35 dollar la ligne modifiée, ça fait mal). Si tu as Cursor ou une solution auto-hébergée sous le coude, c'est le moment d'y regarder sérieusement.

OutilsOutil
1 source
Microsoft Agent 365 ; la plateforme conçue pour piloter vos assistants IA
26Le Big Data 

Microsoft Agent 365 ; la plateforme conçue pour piloter vos assistants IA

Microsoft a mis en disponibilité générale le 1er mai 2026 sa plateforme Agent 365, un centre de contrôle centralisé conçu pour superviser l'ensemble des agents et assistants IA déployés au sein d'une organisation. Présentée une première fois lors du Microsoft Ignite du 18 novembre 2025, la plateforme s'intègre à la Frontier Suite et à Copilot Studio. Elle repose sur cinq piliers fonctionnels : inventaire des agents actifs, contrôle des opérations, visualisation des activités, interopérabilité entre systèmes, et sécurité des données. L'interface unique agrège toutes ces informations pour les directions informatiques qui gèrent simultanément plusieurs assistants spécialisés, certains dédiés à la relation client, d'autres aux processus internes. L'enjeu est considérable : contrairement aux assistants conversationnels classiques qui se contentent de répondre à des questions, les agents IA de nouvelle génération peuvent exécuter des actions concrètes, interagir avec des applications métiers et prendre des décisions autonomes dans un périmètre défini. Cette autonomie accrue crée un angle mort de gouvernance pour les entreprises qui déploient ces outils à grande échelle : sans cadre centralisé, il devient difficile de savoir ce que font réellement les agents, quelles données ils touchent, et si leurs actions respectent les politiques de conformité. Agent 365 se positionne précisément comme la réponse à ce problème, en permettant d'appliquer des règles de sécurité uniformes à travers tout l'écosystème IA de l'entreprise. La plateforme s'inscrit dans un virage stratégique plus large de Microsoft, qui ne cherche plus seulement à fournir des outils de création d'agents via Copilot Studio, mais aussi à proposer la couche d'administration qui permet de les opérer à l'échelle. Après plusieurs mois de déploiements progressifs et de tests, le passage en disponibilité générale en mai 2026 marque la maturité de cette approche. Microsoft se retrouve ainsi en concurrence directe avec des acteurs comme ServiceNow ou Salesforce, qui développent leurs propres frameworks d'orchestration d'agents. La question qui s'ouvre pour les entreprises est celle du verrouillage : adopter Agent 365 comme plan de contrôle unique, c'est aussi lier davantage son infrastructure IA à l'écosystème Microsoft, au moment même où les agents autonomes commencent à toucher aux processus les plus critiques de l'entreprise.

UELes entreprises européennes déployant Copilot Studio et Microsoft 365 sont directement concernées par cette couche de gouvernance, qui soulève également la question du verrouillage technologique à l'heure où l'UE pousse à la souveraineté numérique.

OutilsOutil
1 source
Microsoft Build 2026 : comment suivre en direct la grande conférence sur Windows et Copilot ?
27Numerama 

Microsoft Build 2026 : comment suivre en direct la grande conférence sur Windows et Copilot ?

Microsoft tient sa conférence annuelle Build 2026 cette semaine, réunissant les développeurs du monde entier pour présenter ses grandes orientations technologiques. L'événement se déroule dans un calendrier serré entre les deux autres rendez-vous majeurs du secteur : il succède d'une semaine à la Google I/O et précède d'une semaine la WWDC d'Apple, confirmant que juin s'impose comme le mois stratégique où les trois géants dévoilent leurs ambitions aux développeurs. Microsoft Build s'annonce cette année comme un moment charnière pour la firme de Redmond, qui doit démontrer que Windows et son assistant Copilot occupent une place centrale dans l'écosystème de l'intelligence artificielle générative. L'enjeu est considérable : convaincre une communauté de développeurs attentive aux signaux de Google et Apple que la plateforme Microsoft reste incontournable à l'heure où l'IA redessine les usages professionnels et grand public. Microsoft arrive à cette conférence dans un contexte de compétition intense sur le front de l'IA. Copilot, intégré à Windows et aux outils Office, se mesure directement aux assistants de Google et aux ambitions d'Apple en matière d'intelligence artificielle sur appareil. La Build constitue traditionnellement le terrain où Microsoft fixe sa feuille de route technique pour les douze mois suivants, avec des annonces qui orientent les choix d'investissement des équipes de développement à l'échelle mondiale.

UELes annonces de Microsoft Build 2026 sur Copilot et Windows concernent les développeurs et entreprises européens qui utilisent la suite Microsoft 365 et Azure.

OutilsActu
1 source
Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage
28Ars Technica AI 

Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage

GitHub a officiellement basculé ses abonnés Copilot vers un nouveau modèle de facturation à l'usage, après l'annonce faite en avril. Ce changement, entré en vigueur ce mois-ci, remplace l'ancien système de "requêtes" et de "requêtes premium" allouées selon le tier d'abonnement. Résultat : des milliers d'utilisateurs découvrent avec stupeur que leur usage habituel de l'outil IA épuise leur quota mensuel en quelques heures à peine. Sur les réseaux sociaux et les forums, des développeurs partagent leurs statistiques personnelles montrant que quelques heures d'utilisation intensive peuvent suffire à consommer l'essentiel de leur crédit mensuel. Certains rapportent avoir vidé leur quota en moins d'une journée. L'impact est particulièrement brutal pour les développeurs qui utilisaient Copilot de manière intensive, notamment pour les sessions de codage autonome longues durée. GitHub justifie ce changement en expliquant que l'ancien système créait une inégalité flagrante : une simple question en chat et une session de plusieurs heures coûtaient la même chose à l'utilisateur, obligeant GitHub à absorber silencieusement des coûts d'inférence en forte hausse. Des estimations produites par l'outil de calcul officiel de GitHub montrent que l'usage mensuel standard de certains abonnés aurait généré des factures de plusieurs milliers de dollars sous le nouveau régime tarifaire. Ce tournant illustre une tension structurelle qui s'intensifie dans tout le secteur : les éditeurs d'outils IA ont longtemps proposé des tarifs forfaitaires pour attirer les utilisateurs, mais la montée en puissance des modèles et la hausse des coûts de calcul rendent ce modèle économiquement intenable. GitHub, propriété de Microsoft, suit ainsi une tendance observable chez d'autres acteurs comme Cursor ou Windsurf, qui ont également ajusté leurs politiques tarifaires face à l'explosion des coûts d'inférence liés aux agents IA autonomes. La transition vers la facturation à l'usage pourrait redéfinir durablement la façon dont les développeurs calibrent leur utilisation des assistants de code, et forcer un arbitrage plus conscient entre productivité et coût.

UELes développeurs européens utilisant GitHub Copilot sont directement concernés par ce changement tarifaire et doivent réévaluer leurs habitudes d'utilisation ou arbitrer entre productivité et coût mensuel.

OutilsOutil
1 source
Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock
29AWS ML Blog 

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

OpenAI et Amazon Web Services ont rendu officiellement disponibles, début juin 2026, GPT-5.5, GPT-5.4 et l'agent de code Codex sur Amazon Bedrock, un mois après l'annonce de leur partenariat élargi. Les trois modèles sont désormais accessibles en production via le catalogue Bedrock, avec une tarification identique à celle pratiquée directement par OpenAI, sans frais supplémentaires. GPT-5.5, le modèle le plus avancé de la gamme, excelle dans les tâches agentiques complexes : rédaction et débogage de code sur de grandes bases, analyse de données, génération de documents, et exécution autonome de séquences multi-étapes. Codex, l'agent de développement logiciel d'OpenAI, comptabilise plus de 5 millions d'utilisateurs hebdomadaires et est désormais accessible via l'application Codex, le CLI, ainsi que les intégrations IDE pour Visual Studio Code, JetBrains et Xcode, avec toute l'inférence routée par Bedrock. Pour les entreprises, cette disponibilité générale représente un changement opérationnel concret : les appels aux modèles OpenAI s'intègrent désormais dans les engagements AWS existants, comptent dans les crédits contractuels, et bénéficient des mécanismes de gouvernance déjà en place, notamment les permissions IAM, l'isolation réseau via VPC et PrivateLink, le chiffrement KMS et les journaux d'audit CloudTrail. Bedrock garantit par ailleurs une file d'attente isolée par client avec gestion automatique de la capacité, ce qui assure une performance prévisible même sous forte charge. Fait notable pour les secteurs réglementés : les prompts et réponses ne sont pas utilisés pour entraîner les modèles, et ne sont pas partagés avec OpenAI. Amgen, le géant pharmaceutique, a déjà exprimé son intérêt, son directeur technique Sean Bruich soulignant la qualité et la consistance de GPT-5.5 pour des contextes où la précision scientifique est critique. Ce déploiement s'inscrit dans une dynamique de consolidation entre les grands fournisseurs de cloud et les développeurs de modèles frontière. OpenAI cherche à multiplier les canaux de distribution pour ses modèles, en s'appuyant sur les infrastructures cloud existantes pour atteindre des clients enterprise déjà engagés avec AWS, plutôt que de les forcer à migrer vers une API directe. Pour Amazon, intégrer GPT-5.5 aux côtés de ses propres modèles Titan et des offres Anthropic et Mistral déjà disponibles sur Bedrock renforce le positionnement de la plateforme comme guichet unique du marché des modèles. L'enjeu sous-jacent est la rétention des dépenses cloud enterprise : en faisant compter l'usage d'OpenAI dans les engagements AWS, les deux sociétés créent une friction supplémentaire contre la migration vers Azure ou Google Cloud, où GPT-5.5 est également accessible.

UELes entreprises européennes sous contrat AWS peuvent désormais accéder aux modèles GPT-5.5 et Codex via Bedrock avec des garanties de conformité adaptées au RGPD (données non utilisées pour l'entraînement, isolation réseau VPC, chiffrement KMS), facilitant l'adoption dans les secteurs réglementés.

Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant
30AWS ML Blog 

Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant

Amazon Web Services vient d'annoncer une combinaison technique qui pourrait transformer le déploiement de grands modèles de langage en production : l'utilisation conjointe d'Amazon FSx for Lustre, de NVIDIA GPUDirect Storage (GDS) et d'une nouvelle technique de quantification appelée TurboQuant. Concrètement, charger un modèle comme Llama 3.1 405B, soit environ 800 gigaoctets de poids en BF16, prend aujourd'hui entre 10 et 20 minutes avec une infrastructure classique. Avec GDS sur les nouvelles instances P6 et P6e d'AWS, propulsées par l'architecture NVIDIA Blackwell, ce délai tombe à quelques secondes. Le flagship P6e UltraServer concentre 72 GPU Blackwell dans un seul domaine NVLink, avec 13,4 téraoctets de mémoire HBM3e et 360 pétaflops de calcul en FP8. Le problème que résout cette approche est fondamental pour l'industrie de l'inférence à grande échelle. Dans le pipeline traditionnel, les poids du modèle transitent séquentiellement depuis le stockage vers la RAM CPU, sont désérialisés, éventuellement quantifiés, puis copiés un par un vers chaque GPU via le bus PCIe. Pendant tout ce temps, parfois vingt minutes, les GPU les plus chers de l'infrastructure restent inactifs. GPUDirect Storage court-circuite entièrement ce chemin : les checkpoints du modèle sont pré-découpés en fragments sur FSx for Lustre, et les huit GPU d'une instance lisent leurs fragments en parallèle directement dans leur mémoire HBM, sans jamais passer par le CPU ni le PCIe. L'impact est immédiat sur trois métriques critiques : la latence au premier token lors d'un démarrage à froid, la réactivité de l'autoscaling lors des pics de charge, et le coût d'infrastructure lié aux GPU qui attendent. Cette annonce s'inscrit dans une course à l'optimisation de l'inférence LLM qui s'est intensifiée depuis l'émergence de modèles à plusieurs centaines de milliards de paramètres. Des frameworks comme vLLM ont certes amélioré le chargement parallèle des poids depuis la version 0.19 et son moteur V1, mais les données continuent d'emprunter le CPU et le bus PCIe, une limitation structurelle que GDS supprime à la racine. AWS introduit simultanément TurboQuant, une technique de mise en cache KV qui permet d'augmenter significativement la taille des fenêtres de contexte disponibles sur ces instances. Ces deux avancées combinées positionnent AWS comme un acteur offensif sur le marché de l'infrastructure d'inférence, face à des concurrents comme Google Cloud et Azure qui développent leurs propres accélérateurs et solutions de stockage haute performance pour répondre aux mêmes contraintes.

UELes entreprises européennes déployant des LLMs à grande échelle sur AWS pourront réduire significativement leurs coûts d'infrastructure liés aux GPU inactifs au démarrage, avec un impact direct sur la compétitivité des services d'inférence en Europe.

InfrastructureOpinion
1 source
Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer
31Le Big Data 

Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer

Microsoft Build 2026 ouvre ses portes les 2 et 3 juin au Fort Mason Center de San Francisco, avec un accès en ligne gratuit pour les développeurs du monde entier. Satya Nadella prendra la parole en keynote dès 9h30 heure du Pacifique. L'édition 2026 tourne résolument autour de l'IA agentique : des systèmes capables non plus seulement de répondre à des questions, mais d'agir de manière autonome sur des tâches complexes, en coordonnant plusieurs agents entre eux. Azure AI Foundry est présenté comme le socle technique de ces architectures multi-agents. GitHub Copilot devrait lui aussi franchir un cap, avec des capacités renforcées de débogage, de tests et de correction de code. Reuters signale en parallèle que Microsoft prépare de nouveaux modèles maison, dont un orienté code, pour alimenter Copilot. Côté Windows, Windows AI Foundry permettrait aux applications d'exécuter certains modèles directement sur les PC, via NPU, GPU ou CPU, sans passer par le cloud. Ces annonces dépassent largement le cercle des développeurs. Si les briques agentiques déployées sur Azure finissent intégrées dans Excel, Teams ou Outlook, elles modifieront concrètement les flux de travail de millions d'utilisateurs en entreprise. L'exécution locale des modèles via Windows AI Foundry présente des avantages tangibles : latence réduite, confidentialité améliorée et fonctionnement hors ligne. Microsoft devrait aussi détailler comment réduire les coûts et les délais du passage des prototypes IA à la production, un point de friction majeur pour les équipes qui cherchent à industrialiser ces outils. L'enjeu est de rendre ces technologies utilisables à grande échelle, pas seulement impressionnantes en démonstration. Microsoft Build 2026 s'inscrit dans une course effrénée entre les grands acteurs technologiques pour imposer leurs plateformes comme infrastructure de référence de la prochaine génération d'applications IA. Google, Amazon et Meta jouent la même partition, et chaque Build est aussi une occasion pour Microsoft de montrer que son investissement massif dans OpenAI et dans Azure se traduit en outils concrets pour les développeurs. Le Windows Agent Framework, pressenti pour transformer les agents IA en fonctionnalités système à part entière, et un Windows Agent Store avec un partage de revenus à 85% pour les éditeurs, témoignent d'une ambition claire : faire de Windows une plateforme agentique native. Ce que Build ne montrera probablement pas : du nouveau matériel Surface, un Windows 12 ou des surprises Xbox. L'événement est avant tout une vitrine pour les outils que Microsoft veut mettre dans les mains des développeurs afin de construire la prochaine vague d'applications IA, dont les effets réels se feront sentir sur les mois qui suivent.

UELes développeurs et entreprises européens utilisant Azure et GitHub Copilot seront directement impactés par les nouvelles capacités agentiques, tandis que l'exécution locale de modèles via Windows AI Foundry pourrait faciliter la conformité RGPD en réduisant les transferts de données vers le cloud.

OutilsOutil
1 source
☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique
32Next INpact 

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique

Microsoft travaille sur une application unique destinée à regrouper l'ensemble de ses assistants Copilot sous une seule interface. Selon des informations rapportées par Fortune, ce projet de « superapp » constituerait un guichet centralisé donnant accès à tous les Copilot disponibles selon le profil de l'utilisateur, qu'il soit grand public, développeur ou professionnel. L'application intégrerait également un système d'automatisation par agents IA baptisé Autopilot. Microsoft pourrait en parler dès cette semaine lors de sa conférence Build, sans forcément montrer le produit lui-même, mais un lancement effectif est évoqué avant la fin de l'été 2026. La nécessité de cette consolidation est réelle : Microsoft s'est retrouvé à multiplier les déclinaisons de Copilot au point que même les utilisateurs avertis peinent à s'y retrouver. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public... chaque service cible un usage distinct, mais leur coexistence sans fil directeur clair crée une confusion préjudiciable à l'adoption. En mars 2026, Satya Nadella avait déjà réagi en nommant Jacob Andreou responsable de la cohérence de tout l'écosystème Copilot, signalant que la situation était devenue ingérable. La superapp serait la réponse architecturale à ce problème de lisibilité, avec l'ambition de répondre à l'ensemble des besoins d'un utilisateur depuis un point d'entrée unique. Cette initiative s'inscrit dans une course plus large entre les grands acteurs de l'IA à imposer une application centrale dans le quotidien numérique des utilisateurs. OpenAI poursuit un objectif similaire avec sa propre superapp, construite autour de l'outil de vibe coding Codex et visant à couvrir aussi bien les usages grand public que les profils techniques. Pour Microsoft, l'enjeu est double : regagner la confiance d'utilisateurs lassés par l'omniprésence parfois intrusive de l'IA dans Windows, que l'éditeur avait déjà commencé à atténuer, tout en consolidant sa position face à des concurrents qui proposent des expériences plus cohérentes. Le pari de la superapp n'est cependant pas sans risque : une interface fourre-tout peut complexifier l'expérience autant qu'elle la simplifie, surtout pour des utilisateurs qui cherchent à accomplir une tâche précise sans se perdre dans un menu d'options.

UELes entreprises françaises et européennes utilisant Microsoft 365 Copilot seront directement concernées par cette refonte de l'interface, qui modifiera leur expérience quotidienne avec les outils IA Microsoft déjà largement déployés.

💬 C'est la reconnaissance officielle que Microsoft a transformé Copilot en labyrinthe. Ça fait des mois qu'on se demande "mais c'est lequel le vrai Copilot ?", et là ils admettent que même eux n'arrivent plus à gérer. Reste à voir si une superapp résout vraiment le problème ou si elle ajoute juste une couche de menu au-dessus du chaos.

OutilsOpinion
1 source
Le jour d'indépendance de Microsoft dans l'IA
33The Information AI 

Le jour d'indépendance de Microsoft dans l'IA

Microsoft a ouvert mardi sa conférence annuelle Build 2026 à San Francisco, devant quelque 2 500 développeurs d'applications. L'événement prend cette année une coloration particulière : il survient deux mois après ce que la presse américaine a qualifié de "découplage conscient" entre Microsoft et OpenAI, et sert de vitrine officielle aux modèles d'intelligence artificielle que Microsoft développe désormais en propre, sans s'appuyer sur la technologie du créateur de ChatGPT ni sur celle d'Anthropic. Pour Microsoft, l'enjeu est de taille : prouver que sa division IA peut rivaliser de façon autonome sur un marché où OpenAI et Anthropic s'imposent comme références. Proposer ses propres modèles aux développeurs signifie réduire sa dépendance structurelle vis-à-vis d'un partenaire avec lequel les tensions se sont accumulées, tout en reprenant la main sur la chaîne de valeur. Pour les milliers d'équipes qui bâtissent des applications sur l'écosystème Microsoft, le signal est clair : une alternative interne existe désormais. Cette émancipation s'inscrit dans une reconfiguration profonde des alliances dans l'industrie de l'IA. Microsoft a investi des milliards de dollars dans OpenAI depuis 2019, intégrant ses modèles dans Azure, Copilot et Office. Mais la multiplication des acteurs, la montée en puissance des modèles open source et les frictions stratégiques entre les deux entreprises ont accéléré l'ambition de Redmond de contrôler sa propre pile technologique. Build 2026 marque symboliquement ce tournant.

UELes entreprises et développeurs européens qui s'appuient sur l'écosystème Microsoft (Azure, Copilot, Office 365) doivent anticiper une transition vers des modèles maison, avec des implications potentielles sur les contrats, les performances et la roadmap de leurs intégrations IA.

💬 Ça faisait longtemps que ça devait arriver. Mettre des milliards dans OpenAI tout en leur confiant toute la chaîne de valeur, c'est le genre de pari qui finit par se retourner contre toi. Bon, sur le papier c'est la bonne décision, mais leurs modèles maison vont devoir tenir la route face à Claude et GPT, pas juste sur les benchmarks.

BusinessOpinion
1 source
Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes
34The Decoder 

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Microsoft et Nvidia s'apprêtent à dévoiler conjointement une nouvelle génération d'ordinateurs sous Windows, prévue pour la semaine prochaine lors des conférences Computex et Build. Pour la première fois, Nvidia y imposera ses propres puces en tant que processeur principal, rompant avec le monopole d'Intel et AMD sur ce segment. Les premiers appareils concernés seront des machines Dell ainsi que des modèles de la gamme Surface de Microsoft, confirmant une collaboration industrielle inédite entre les deux géants. Le tournant majeur réside dans le logiciel : Microsoft prépare une nouvelle plateforme logicielle basée sur le framework OpenClaw, conçue pour permettre à des agents IA d'exécuter des tâches directement en local sur les PC Windows. Contrairement aux assistants cloud, ces agents fonctionneraient sans connexion internet, traitant données et automatisations directement sur la machine. Pour les professionnels et entreprises soucieux de confidentialité ou de latence, cela représente un changement de paradigme concret dans l'usage quotidien de l'IA. Cette initiative s'inscrit dans la tentative de Microsoft de relancer sa vision des PC augmentés par l'IA, après l'échec commercial relatif des Copilot+ PC lancés en 2024, dont les fonctionnalités comme Recall avaient suscité plus de controverses que d'enthousiasme. En s'appuyant cette fois sur les puces Nvidia et un cadre d'agents autonomes plus opérationnel, Microsoft cherche à convaincre le marché que l'IA embarquée peut tenir ses promesses de productivité réelle. La bataille pour définir le PC de l'ère agentique ne fait que commencer.

UELes entreprises françaises et européennes, particulièrement sensibles au RGPD, bénéficieront d'agents IA fonctionnant en local sans transfert de données vers le cloud, réduisant les risques de conformité.

💬 Après le fiasco Recall, Microsoft repart avec Nvidia et des agents qui tournent en local, sans connexion. Pour les boîtes coincées entre IA et RGPD, c'est le premier truc qui tient vraiment la route depuis longtemps. Bon, faut quand même que ça tienne en prod, parce que les promesses sur les PC IA, on commence à connaître.

InfrastructureOpinion
1 source
Pourquoi ne pas laisser la sélection du modèle par défaut dans Copilot, Gemini et autres outils IA
35The Decoder 

Pourquoi ne pas laisser la sélection du modèle par défaut dans Copilot, Gemini et autres outils IA

Le mathématicien Adam Kucharski a mis en évidence une faille frappante dans Microsoft Copilot : lorsqu'il a soumis à l'outil des jeux de données strictement identiques en changeant uniquement les étiquettes de pays, Copilot a produit des analyses détaillées faisant état de différences nationales qui n'existaient tout simplement pas. Au lieu de détecter l'absence de variation dans les chiffres, le modèle par défaut a généré des stéréotypes circonstanciés, présentant des résultats fabriqués comme s'ils étaient fondés sur les données réelles. Cette expérience, reproductible avec d'autres plateformes comme Gemini, révèle un angle mort systématique dans les outils d'IA généraliste utilisés au quotidien. Le problème n'est pas anodin : des professionnels s'appuient sur ces outils pour analyser des données économiques, sociales ou médicales, et un modèle qui confond ses propres biais culturels avec une analyse factuelle peut conduire à des décisions erronées sans que l'utilisateur s'en aperçoive. Les modèles dits "de raisonnement" (o3 d'OpenAI, les modes thinking de Gemini, etc.) parviennent à détecter ce type de piège, mais uniquement si l'utilisateur choisit activement de les activer, ce que la grande majorité ne fait pas. Ce constat pointe vers un problème de conception plus large : les interfaces de Copilot, Gemini ou ChatGPT proposent un modèle par défaut qui n'est pas nécessairement adapté à toutes les tâches, sans guider l'utilisateur vers le bon outil. Alors que Microsoft et Google intègrent l'IA dans des environnements professionnels sensibles, la question de la sélection automatique ou assistée du modèle selon le contexte d'usage devient un enjeu de fiabilité critique, que les éditeurs n'ont pas encore pleinement résolu.

UELes professionnels européens utilisant Copilot ou Gemini pour analyser des données économiques, sociales ou médicales s'exposent à des décisions fondées sur des analyses fabriquées, un risque de fiabilité directement dans le viseur de l'AI Act pour les systèmes à usage professionnel sensible.

💬 Le test d'Adam Kucharski est glaçant: données identiques, étiquettes de pays changées, et Copilot invente des différences nationales bien argumentées. Le modèle ne ment pas au sens classique, il comble les vides avec ses biais culturels, et ça passe parce que c'est fluide et ça semble fondé. Utiliser ces outils sur des données pro sans activer les modes raisonnement, c'est signer un rapport avec un outil qui hallucine en silence.

ÉthiqueOpinion
1 source
Microsoft lance Fara1.5 (4B/9B/27B), des agents de navigation qui surpassent OpenAI Operator et Gemini 2.5 Computer Use
36MarkTechPost 

Microsoft lance Fara1.5 (4B/9B/27B), des agents de navigation qui surpassent OpenAI Operator et Gemini 2.5 Computer Use

Le laboratoire AI Frontiers de Microsoft Research a publié Fara1.5, une famille de modèles d'agents capables de contrôler un navigateur web de façon autonome. La gamme comprend trois variantes selon leur taille : Fara1.5-4B, Fara1.5-9B et Fara1.5-27B, chiffres qui désignent le nombre de paramètres en milliards. Ces modèles s'intègrent à MagenticLite, l'interface de navigateur sandboxé de Microsoft conçue pour ce type d'agents. Concrètement, ils lisent des captures d'écran et émettent des actions de souris et de clavier pour accomplir des tâches dans un vrai navigateur. Sur le benchmark Online-Mind2Web, qui évalue la réussite de 300 tâches sur 136 sites populaires, Fara1.5-27B atteint un taux de succès de 72 %, contre 58,3 % pour OpenAI Operator et 57,3 % pour Gemini 2.5 Computer Use de Google. La version précédente, Fara-7B, n'atteignait que 34,1 % sur cette même évaluation, soit un quasi-doublement des performances en une génération. Ces résultats placent Microsoft en tête d'une catégorie qui concentre une attention croissante de l'industrie : les agents de type "computer use", capables d'agir directement dans un environnement graphique sans passer par des API dédiées. Pour les entreprises, cela ouvre la possibilité d'automatiser des flux de travail complexes sur n'importe quel site web, sans intégrations spécifiques. Les modèles embarquent également des méta-actions qui permettent à l'agent de mémoriser des informations au fil d'une session longue, ou de solliciter l'utilisateur lorsqu'une étape est ambiguë ou irréversible. Cette capacité à interrompre et à collaborer distingue Fara1.5 des approches entièrement autonomes, souvent jugées trop risquées pour un usage professionnel. Les modèles reposent sur les architectures de base Qwen3.5 et ont été entraînés sur environ deux millions d'exemples, dont 60 % de trajectoires web réelles et 12,8 % d'environnements synthétiques. Pour produire ces données, Microsoft a développé FaraGen1.5, un pipeline comprenant six environnements simulés appelés FaraEnvs, qui reproduisent des services comme la messagerie, le calendrier ou la gestion de flux ML, avec un frontend réaliste et une base de données initialisée par des profils d'utilisateurs fictifs. Le solveur chargé de générer les trajectoires d'entraînement s'appuie lui-même sur GPT-5.4 d'OpenAI, qui atteint 83 % sur Online-Mind2Web en mode automatisé. La compétition dans ce segment s'intensifie rapidement : Yutori avec Navigator n1 (64,7 %), Google et OpenAI investissent massivement dans des agents capables d'agir dans des environnements réels, préfigurant une transition vers des systèmes d'IA qui ne se contentent plus de répondre, mais qui exécutent.

💬 72 % sur Mind2Web, c'est pas anodin quand OpenAI Operator plafonne à 58. Ce qui m'intéresse vraiment, c'est la mécanique de pause : l'agent qui s'arrête pour demander confirmation avant une action irréversible, c'est exactement ce qui manquait pour passer du prototype au vrai usage pro. Reste à voir combien de temps avant qu'on puisse tourner ça en local sans dépendre de l'infra Microsoft.

LLMsActu
1 source
CopilotKit redéfinit l'architecture IA à base d'agents en 2026
37MarkTechPost 

CopilotKit redéfinit l'architecture IA à base d'agents en 2026

CopilotKit, startup basée à Seattle et co-fondée par Atai Barkai et Uli Barkai, s'est imposée en 2026 comme l'un des acteurs centraux de l'infrastructure pour agents IA. La société a lancé en avril 2026 AIMock, un outil de test pour systèmes agentiques, et AG-UI, un protocole d'interaction entre agents et utilisateurs au sein des applications. AG-UI est aujourd'hui soutenu par Google, Microsoft, Amazon et Oracle, ainsi que par des frameworks majeurs comme LangChain, Mastra, PydanticAI et Agno. AWS l'a intégré dans son template FAST (Fullstack AgentCore Solution Template) et dans Bedrock AgentCore. Des SDKs communautaires couvrent déjà Kotlin, Go, Dart, Java, Rust, Ruby et C++, tandis que .NET, Nim, Flowise et Langflow sont en cours de développement. Atai Barkai enseigne par ailleurs un cours complet sur AG-UI chez DeepLearning.AI, couvrant un backend LangChain, un frontend React et AG-UI comme runtime. Ce que CopilotKit résout est concret : jusqu'ici, intégrer une IA dans une application signifiait coller un widget de chat dans un coin d'interface. L'utilisateur tapait, le modèle répondait en texte, et personne ne prenait en charge la traduction de cette réponse en action réelle. AG-UI comble le troisième maillon manquant de la pile agentique : MCP standardise l'accès aux outils externes, A2A coordonne les agents entre eux, AG-UI gère la couche d'interaction entre l'agent, l'application et l'utilisateur. Il permet le streaming en temps réel, la génération dynamique de composants d'interface, la synchronisation d'état bidirectionnelle, et les pauses "human-in-the-loop" où l'agent attend une confirmation avant d'agir. AIMock, lui, s'attaque à un problème que peu d'équipes osent admettre : les suites de tests pour agents sont, pour la plupart, de la fiction. Une requête agentique typique en 2026 traverse six ou sept services (LLM, serveur MCP, base vectorielle, reranker, API de recherche web, couche de modération, sous-agent A2A) et la plupart des équipes n'en simulent qu'un seul, laissant les autres non-déterministes et incontrôlés. L'analogie avancée par CopilotKit est parlante : AG-UI serait à la pile agentique ce que HTML est au web, la couche de présentation et d'interaction que TCP et HTTP rendent possible sans pouvoir la fournir eux-mêmes. Pendant des années, l'IA dans les logiciels est restée un outil passif, fonctionnel comme une calculatrice mais incapable d'agir de façon autonome. CopilotKit parie que l'avenir appartient aux agents qui vivent à l'intérieur des applications, comprennent le contexte de l'utilisateur, prennent des actions et génèrent des interfaces adaptées plutôt que de longs blocs de texte. Avec l'adoption par les grands fournisseurs cloud et l'entrée dans les cursus pédagogiques, la startup semble avoir franchi le cap qui sépare le protocole expérimental de l'infrastructure de production. La prochaine étape annoncée porte sur la persistance runtime, troisième chantier d'une feuille de route 2026 qui vise délibérément les angles morts de l'architecture agentique.

💬 L'idée du maillon manquant est bonne : MCP pour les outils, A2A pour la coordination, AG-UI pour l'utilisateur, la stack agentique commence à avoir une vraie colonne vertébrale. Ce qui me parle autant, c'est AIMock, parce que les suites de tests pour agents c'est de la fiction dans la plupart des équipes, et c'est enfin assumé. AWS dans Bedrock, Google et Microsoft embarqués, bon, sur le papier c'est le seuil qui sépare le protocole expérimental du vrai standard de prod.

InfrastructureOpinion
1 source
Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google
38Le Big Data 

Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google

Anthropic a annoncé le 18 mai 2026 l'acquisition de Stainless, une startup new-yorkaise fondée en 2022 par Alex Rattray, ancien ingénieur de Stripe. Spécialisée dans l'automatisation des SDK et des connecteurs API, Stainless avait bâti en quelques années une position de référence dans l'écosystème IA. Selon The Information, l'opération dépasserait les 300 millions de dollars. La technologie de Stainless transforme des spécifications d'API en kits de développement logiciel prêts pour la production, compatibles avec Python, Go, Java, Kotlin et TypeScript. Son avantage distinctif est la maintenance automatique de ces SDK : à chaque évolution d'une API, les bibliothèques sont mises à jour sans intervention humaine. Anthropic utilisait déjà Stainless depuis les premières versions de son API Claude, mais la startup fournissait également ses outils à OpenAI, Google, Replicate, Runway et Cloudflare. Ces clients perdront l'accès aux produits hébergés de Stainless, dont son générateur de SDK, bien qu'ils conservent la propriété des SDK déjà générés et le droit de les modifier. Cette acquisition positionne Anthropic sur un terrain stratégique qui dépasse le simple rachat technologique. Dans le marché de l'IA agentique, la valeur ne réside plus uniquement dans la puissance des modèles, mais dans leur capacité à se connecter à des systèmes externes, des bases de données et des logiciels métiers. Les SDK, serveurs MCP et connecteurs sont précisément la couche technique qui rend cette connexion possible. En intégrant Stainless, Anthropic renforce toute son infrastructure développeur autour de Claude et prive simultanément ses concurrents directs d'un fournisseur jusqu'ici commun. OpenAI et Google, qui comptaient sur ces outils, devront désormais trouver ou développer des alternatives, ce qui représente un coût de friction non négligeable pour leurs équipes techniques et leurs clients. Cette opération s'inscrit dans une logique que les grandes plateformes cloud ont perfectionnée depuis des décennies. AWS, Microsoft Azure et Google Cloud n'ont pas construit leur domination uniquement sur l'infrastructure brute, mais surtout sur des couches d'outils qui fidélisent les développeurs et rendent le changement de fournisseur coûteux. Anthropic applique aujourd'hui cette même recette au marché des agents IA, en s'appropriant une infrastructure critique juste au moment où la compétition s'intensifie. La société pousse parallèlement son protocole MCP, qui standardise la communication entre agents IA et applications tierces, et Stainless vient directement renforcer cette pile. Le rachat transforme Anthropic d'un fabricant de modèles en véritable opérateur d'infrastructure pour développeurs, un positionnement qui pourrait peser lourd dans la consolidation qui s'annonce dans le secteur.

UELes développeurs européens utilisant les outils Stainless via OpenAI ou Google devront migrer vers des alternatives, renforçant leur dépendance à l'écosystème Anthropic/Claude.

💬 Le vrai coup, c'est pas les 300 millions, c'est qu'OpenAI et Google perdent leur fournisseur de SDK commun du jour au lendemain. La maintenance automatique des bibliothèques à chaque évolution d'API, c'est invisible, mais c'est exactement le genre de truc qui colle aux mains et crée une vraie dépendance. Avec MCP qui pousse en parallèle, Anthropic est en train de bâtir la couche infrastructure dont on ne sort pas facilement.

Des dirigeants de Microsoft alertent sur l'effritement de l'avance de GitHub en matière d'IA
39The Information AI 

Des dirigeants de Microsoft alertent sur l'effritement de l'avance de GitHub en matière d'IA

GitHub, la plateforme de code appartenant à Microsoft, traverse une période de turbulences qui inquiète jusqu'au sommet de l'entreprise. Jay Parikh, le dirigeant responsable de la division incluant GitHub, aurait récemment alerté ses collègues en privé d'une menace critique pesant sur l'unité. Si le boom de l'IA a d'abord profité à GitHub, notamment grâce à Copilot, son assistant de programmation intégré, la plateforme peine désormais à tenir son rang face à une nouvelle vague de concurrents spécialisés dans le code assisté par IA. Des pannes répétées et sévères ont en outre agacé ses grands clients, forçant Microsoft à présenter des excuses publiques. Le problème est structurel : GitHub était en position dominante sur l'assistance au code il y a encore deux ans, mais des outils comme Cursor, Windsurf ou Claude Code ont depuis capté l'attention et les budgets des développeurs professionnels. Ces nouveaux entrants proposent des expériences plus intégrées et plus performantes, rendant Copilot moins différenciant qu'il ne l'était à son lancement en 2021. L'enjeu dépasse la simple part de marché. GitHub représente l'un des actifs stratégiques majeurs acquis par Microsoft pour 7,5 milliards de dollars en 2018, et Copilot était censé en être le moteur de monétisation à l'ère de l'IA. Si la plateforme continue de perdre du terrain, c'est toute la stratégie IA de Microsoft auprès des développeurs qui se retrouve fragilisée, dans un secteur où Anthropic, Google et OpenAI investissent massivement dans des outils concurrents directs.

UELes développeurs européens utilisant GitHub Copilot sont concernés par ce recul compétitif et ont intérêt à réévaluer leurs outils de développement assisté par IA face aux alternatives émergentes.

💬 Copilot a eu une longueur d'avance énorme, et ils l'ont gaspillée. Cursor, Windsurf, Claude Code (oui, j'assume le biais) ont simplement mieux exécuté sur l'expérience développeur, pendant que GitHub gérait des pannes à répétition et sortait des features en demi-teinte. 7,5 milliards en 2018, c'est le prix d'un écosystème qui peut s'évaporer en 18 mois si tu restes sur tes acquis.

BusinessOpinion
1 source
Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents
40Next INpact 

Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents

Mistral AI travaille au développement d'un modèle d'intelligence artificielle dédié à la détection de failles de sécurité dans le code de banques européennes, selon des informations rapportées par Bloomberg. La startup française, qui collaborait déjà avec ses clients du secteur bancaire sur ces problématiques avant le lancement de Mythos par Anthropic en avril dernier, prépare désormais une version "clé en main" pour un déploiement plus large. En parallèle, Microsoft a dévoilé MDASH, pour "Microsoft Security multi-model agentic scanning harness", un système de sécurité agentique mobilisant plusieurs modèles d'IA complémentaires et une centaine d'agents spécialisés. Sur le benchmark CyberGym, qui regroupe plus de 1 500 tâches reproduisant des vulnérabilités réelles, MDASH affiche un taux de réussite de 88,45 %, soit environ 5 points de mieux que son concurrent le plus proche. Le système a déjà permis d'identifier 16 vulnérabilités dans l'authentification et l'infrastructure réseau de Windows, dont 4 failles critiques permettant l'exécution de code à distance. La détection automatisée de vulnérabilités par IA est en train de passer du statut d'expérimentation de laboratoire à celui d'outil industriel déployé à grande échelle, c'est le constat que Microsoft formule explicitement. Pour les entreprises et institutions gérant des infrastructures critiques, l'enjeu est considérable : des systèmes capables d'ausculter des millions de lignes de code en continu représentent un saut qualitatif majeur face aux audits manuels. Mais cette puissance soulève aussi une question de dépendance stratégique : qui contrôle ces outils, et sur quel code s'appliquent-ils ? C'est précisément ce point qu'Arthur Mensch, directeur général de Mistral, a soulevé cette semaine devant la commission d'enquête sur les vulnérabilités numériques à l'Assemblée nationale. Sans nommer Anthropic, il a pointé le risque de confier le code et les bases de données de l'armée française à un modèle étranger comme Mythos, actuellement distribué au compte-gouttes auprès d'organisations majoritairement américaines, sans accès accordé à l'Europe. L'argument est limpide : la cybersécurité par IA est un sujet régalien, et la souveraineté technologique devient un critère non négociable. Mistral se positionne ainsi comme alternative européenne crédible dans une course qui oppose déjà Anthropic, OpenAI avec son initiative Daybreak, et désormais Microsoft. La question des certifications, des audits et de la gouvernance de ces outils devrait rapidement s'imposer dans les débats réglementaires européens.

UEMistral AI développe un modèle de cybersécurité souverain ciblant les banques européennes et les infrastructures militaires françaises, tandis qu'Arthur Mensch alerte l'Assemblée nationale sur le risque stratégique de confier le code de l'armée française à des modèles américains sans accès garanti à l'Europe.

💬 Ce que dit Mensch à l'Assemblée, c'est pas du lobbying habillé en souveraineté, c'est du bon sens brut : si tu confies le code de l'armée française à un modèle américain qui filtre lui-même ses accès européens, tu perds la main sur ta propre infrastructure critique. Microsoft affiche 88% sur CyberGym et 4 failles critiques trouvées dans Windows, le niveau monte vite. Mistral a l'argument souveraineté, reste à voir si ça pèse face à des chiffres pareils.

SécuritéOpinion
1 source
Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI
41The Information AI 

Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI

Microsoft a investi 13 milliards de dollars dans OpenAI sur plusieurs années, obtenant en échange un droit exclusif de revendre les modèles de langage de la startup à d'autres entreprises via son cloud Azure. Pendant trois ans, Microsoft était ainsi le seul fournisseur cloud autorisé à commercialiser GPT-4 et ses successeurs auprès des professionnels. Malgré cet avantage concurrentiel, les données révèlent que les entreprises ont acheté davantage de capacités directement auprès d'OpenAI que via Microsoft durant cette période. Selon les estimations de The Information, basées sur des documents financiers d'OpenAI et des témoignages internes, Microsoft a toutefois déjà récupéré plus du double de son investissement initial en revenus nouveaux générés par les services liés à la technologie d'OpenAI. Ce résultat illustre que la valeur du partenariat pour Microsoft dépasse largement la simple revente de modèles. L'intégration de Copilot dans Microsoft 365, Azure OpenAI Service et les outils GitHub ont tous bénéficié directement de l'accès privilégié aux modèles d'OpenAI, générant des milliards de revenus supplémentaires que la comptabilité classique ne capturait pas forcément. Ce partenariat s'est construit dans un contexte de course effrénée à l'IA générative, où Microsoft cherchait à rattraper Google sur le terrain de la recherche et des outils de productivité. La relation entre les deux entreprises reste toutefois complexe : OpenAI développe désormais ses propres offres cloud concurrentes, et l'exclusivité commerciale de Microsoft s'érode progressivement, redessinant les contours d'une alliance stratégique à plusieurs dizaines de milliards de dollars.

UEL'érosion progressive de l'exclusivité commerciale de Microsoft sur les modèles OpenAI pourrait modifier les conditions d'accès et de tarification pour les entreprises européennes utilisant Azure OpenAI Service.

BusinessActu
1 source
5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer
42VentureBeat AI 

5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer

Les entreprises ont dépensé des milliards pour sécuriser des GPU à tout prix, et la facture est désormais présentée. Selon Gartner, l'infrastructure IA représente 401 milliards de dollars de nouvelles dépenses en 2025, mais des audits terrain révèlent une réalité bien plus sombre : le taux d'utilisation moyen des GPU en entreprise stagne à 5 %. Pendant deux ans, la panique du « GPU scramble » a poussé DSI et directions financières à constituer des réserves de capacité sous des cycles d'amortissement de trois à cinq ans. Ces actifs sont désormais des coûts fixes inscrits aux bilans, indépendamment de leur usage effectif. Les chiffres du Q1 2026 confirment le basculement : dans le baromètre de VentureBeat, le critère « accès aux GPU » est passé de 20,8 % à 15,4 % en un seul trimestre comme moteur principal des décisions d'achat, tandis que le coût par inférence et le TCO (coût total de possession) bondissaient de 34 % à 41 %, dépassant la performance pure comme critère dominant. À 5 % d'utilisation, l'arithmétique est brutale : pour chaque dollar investi en silicium, 95 centimes partent directement dans la marge des fournisseurs cloud. Dans n'importe quel autre département, un taux de gaspillage de 95 % serait un motif de licenciement ; dans l'infrastructure IA, on appelait ça de la « préparation ». Les grands groupes comme Intuit, Mastercard ou Pfizer, qui bénéficiaient de relations privilégiées avec AWS, Azure et GCP pour sécuriser des réservations de capacité, se sont retrouvés riches en GPU mais pauvres en production : des équipes internes paralysées par la gouvernance des données, la gravité des données et une immaturité architecturale persistante ont empêché toute valorisation réelle de ces ressources. Le discours dominant sur la rareté du silicium a servi d'écran commode pour masquer cette inefficacité structurelle. Ce virage marque la fin de l'ère du chèque en blanc. Le passage à une tarification à l'usage en 2026 transforme les architectures héritées des phases pilotes, pensées avec des tokens en coûts fixes, en véritables passifs financiers. Les agents en contexte long et les pipelines de récupération complexes, construits quand les tokens étaient un coût noyé dans des licences forfaitaires, deviennent intenables sous une facturation mesuréé. L'inférence n'est plus un projet tactique : c'est un modèle économique stratégique dont les unités économiques sont, pour la plupart des entreprises, encore insoutenables. La question n'est plus de savoir si les investissements passés étaient justifiés, mais comment extraire un retour mesurable d'une infrastructure déjà déployée avant que les cycles d'amortissement ne l'emportent.

UELes entreprises européennes investies en infrastructure GPU sont exposées au même risque de sous-utilisation à 5 %, avec des cycles d'amortissement sur 3-5 ans qui transforment ces actifs en passifs financiers au moment où le marché bascule vers une tarification à l'usage.

💬 5 % d'utilisation, c'est le genre de stat qui ferait renvoyer n'importe quel responsable infra dans un département classique. La panique du GPU scramble a servi de couverture : on achetait du silicium pour ne pas rater le train, sans se demander si les équipes data étaient capables d'en faire quelque chose. Le basculement vers le pay-as-you-go va transformer ces réserves en passifs, et ça va faire des dégâts.

InfrastructureOpinion
1 source
Microsoft allège Copilot
43The Information AI 

Microsoft allège Copilot

Microsoft réduit la voilure sur sa stratégie Copilot. Asha Sharma, nouvellement nommée PDG de la division Xbox, a annoncé cette semaine la fermeture de Gaming Copilot, un chatbot intégré aux applications mobiles et PC de Xbox. Ce retrait marque un premier recul concret dans une offensive commerciale qui avait conduit Microsoft à déployer des fonctionnalités estampillées Copilot dans des dizaines de produits : Office, Bing, PowerBI, Dynamics, et bien d'autres. L'entreprise avait lancé cette vague d'intégrations après avoir obtenu les droits d'utilisation de la technologie d'OpenAI. Ce désengagement partiel intervient en réponse à des critiques de plus en plus nombreuses de la part des utilisateurs et des clients professionnels, qui jugent ces fonctionnalités inutiles ou intrusives. Le cas Xbox est révélateur : un chatbot embarqué dans une application de jeu répond à un besoin que la plupart des joueurs ne ressentent pas. Microsoft semble prendre acte que l'enthousiasme interne pour l'IA générative n'a pas toujours correspondu à une demande réelle du terrain. Ce virage illustre une tendance plus large dans le secteur tech : après la phase d'hyper-intégration de l'IA dans tous les produits, les grandes entreprises commencent à évaluer la valeur réelle de chaque fonctionnalité. Microsoft avait misé massivement sur OpenAI, investissant plusieurs milliards de dollars depuis 2019, et avait fait du déploiement accéléré de Copilot un axe stratégique central. La question qui se pose désormais est de savoir jusqu'où cette rationalisation ira, et quels autres produits Copilot pourraient être abandonnés.

UELes entreprises et administrations européennes déployant Microsoft Copilot dans leurs outils de productivité (Office, Dynamics) pourraient voir certaines fonctionnalités IA rationalisées ou supprimées dans les prochains mois.

BusinessOpinion
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
44MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source
OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA
45The Decoder 

OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA

OpenAI a annoncé la mise au point du protocole réseau MRC en collaboration avec AMD, Broadcom, Intel, Microsoft et NVIDIA. Ce protocole open source permet de transmettre des données simultanément sur des centaines de chemins entre les GPU, là où les architectures traditionnelles n'en empruntent qu'un à la fois. Là où les infrastructures classiques nécessitent trois ou quatre couches de commutateurs réseau pour relier des dizaines de milliers de puces, MRC n'en requiert que deux pour interconnecter plus de 100 000 GPU. Le protocole est déjà opérationnel sur le supercalculateur Stargate d'OpenAI. Cette simplification de l'architecture réseau a des conséquences directes sur les coûts et la consommation d'énergie des centres de données d'IA. Supprimer une à deux couches de commutateurs représente une économie substantielle en matériel, en câblage et en électricité, à une époque où les dépenses en infrastructure IA atteignent des dizaines de milliards de dollars par an. Pour les opérateurs de supercalculateurs, cette approche permet d'atteindre des échelles inédites tout en maîtrisant la facture énergétique, un enjeu majeur alors que la consommation des data centers est de plus en plus scrutée. Le projet Stargate, dont les investissements annoncés dépassent 500 milliards de dollars sur plusieurs années, illustre l'ambition d'OpenAI de bâtir sa propre infrastructure de calcul à très grande échelle. La création d'un protocole open source, développé en consortium avec les principaux fabricants de semi-conducteurs et Microsoft, signale une volonté de standardiser les communications entre GPU à l'échelle des supercalculateurs modernes. En ouvrant MRC, OpenAI mise sur une adoption large qui pourrait en faire un standard de fait pour l'industrie.

UELe protocole MRC pourrait réduire la consommation énergétique des supercalculateurs IA, un enjeu directement encadré par la réglementation européenne sur l'efficacité énergétique des centres de données.

💬 Enlever une à deux couches de commutateurs sur 100 000 GPU, ça veut dire des centaines de millions en matériel et en électricité économisés, pas un détail à cette échelle. Ce qui me frappe, c'est qu'OpenAI ouvre le protocole en consortium avec AMD, Broadcom, Intel et NVIDIA, plutôt que de le garder propriétaire. La stratégie est lisible : faire de MRC un standard de fait avant que quelqu'un d'autre s'y colle.

InfrastructureOpinion
1 source
Google, Microsoft et xAI autorisent le gouvernement américain à examiner leurs nouveaux modèles d'IA
46The Verge AI 

Google, Microsoft et xAI autorisent le gouvernement américain à examiner leurs nouveaux modèles d'IA

Google DeepMind, Microsoft et xAI, la société d'intelligence artificielle d'Elon Musk, ont accepté de soumettre leurs nouveaux modèles d'IA à une évaluation gouvernementale avant tout déploiement public. L'annonce, faite mardi par le Centre pour les standards et l'innovation en IA (CAISI) du département américain du Commerce, prévoit des "évaluations pré-déploiement et des recherches ciblées" pour mieux mesurer les capacités des modèles dits frontières. Le CAISI, qui travaille avec OpenAI et Anthropic depuis 2024, revendique déjà 40 évaluations réalisées à ce jour. Ces partenariats représentent un mécanisme de surveillance inédit sur les systèmes d'IA les plus puissants du monde, donnant aux autorités fédérales américaines un accès anticipé à des technologies qui n'ont encore jamais été soumises à un contrôle institutionnel systématique avant leur commercialisation. Pour l'industrie, cela signifie une normalisation progressive du contrôle gouvernemental comme étape du cycle de développement, ce qui pourrait influencer les pratiques mondiales et peser sur les délais de mise sur le marché. OpenAI et Anthropic ont par ailleurs renégocié leurs accords existants avec le CAISI pour mieux les aligner sur les priorités de l'administration Trump, dont la position sur la régulation de l'IA s'est voulue plus souple que celle de son prédécesseur, mais qui cherche néanmoins à garder la main sur les développements stratégiques du secteur. Ces initiatives s'inscrivent dans une compétition technologique mondiale exacerbée, notamment face à la Chine, où l'accès gouvernemental aux modèles frontières est présenté comme un impératif de sécurité nationale autant que de compétitivité.

UECe mécanisme américain de contrôle pré-déploiement pourrait servir de référence pour les autorités européennes dans l'application de l'AI Act, notamment pour les évaluations obligatoires des modèles frontières à haut risque.

💬 Quarante évaluations réalisées, et personne n'en avait entendu parler. C'est le genre d'accord qui se vend comme de la transparence mais qui sert surtout à donner au gouvernement américain un regard en avance sur ce qui sort, dans une logique de sécurité nationale plus que de protection des utilisateurs. Si l'UE s'en inspire pour l'AI Act, bon, ça pourrait au moins donner un cadre concret à ces évaluations frontières qu'on attend depuis des mois.

Au-delà du Copilot : Classiq invente l’ingénieur quantique virtuel
47Le Big Data 

Au-delà du Copilot : Classiq invente l’ingénieur quantique virtuel

La start-up israélienne Classiq vient de franchir une étape significative dans la démocratisation du calcul quantique en intégrant un agent d'intelligence artificielle générative au coeur de sa plateforme de développement. Concrètement, cet outil permet à un responsable technique ou à un ingénieur métier de décrire un problème en langage naturel, en français ou en anglais, et d'obtenir en retour une architecture logicielle quantique compilable. L'agent ne se contente pas de générer du texte : il synthétise du code en tenant compte des contraintes physiques réelles des processeurs quantiques actuels, garantissant ainsi que les programmes produits sont réellement exécutables et non de simples ébauches conceptuelles. Nir Minerbi, fondateur et PDG de Classiq, présente cet outil comme une passerelle directe entre les problématiques concrètes des entreprises et les actifs numériques exploitables sur les machines de demain. L'enjeu est considérable pour des secteurs comme la finance quantitative, la chimie computationnelle ou la conception de nouveaux matériaux, où la rapidité d'itération conditionne l'avantage concurrentiel. Jusqu'ici, programmer pour un ordinateur quantique exigeait une maîtrise pointue de la physique des qubits, un profil rare et coûteux que peu d'entreprises pouvaient s'offrir à grande échelle. En automatisant l'intégralité du cycle de développement, de la traduction du besoin métier jusqu'à l'optimisation des circuits, Classiq libère les équipes des tâches de «tuyauterie» complexe et leur permet de concentrer leurs efforts sur la valeur ajoutée. Pour les directions informatiques, c'est aussi l'assurance d'un investissement durable : le code généré s'adapte aux évolutions matérielles sans devenir obsolète à chaque mise à jour des processeurs. L'adoption du calcul quantique par les grandes entreprises bute depuis des années sur un double obstacle : la rareté des experts capables d'écrire des algorithmes quantiques, et la fragmentation d'un écosystème où chaque génération de machines impose de réécrire le code from scratch. Plusieurs acteurs, dont IBM, Google et IonQ, investissent massivement pour abaisser cette barrière d'entrée, mais l'approche de Classiq se distingue en ciblant explicitement la couche de développement logiciel plutôt que le matériel. En structurant la connaissance quantique dans des bibliothèques réutilisables gérées par des agents experts, la start-up entend faire entrer ce calcul de haute performance dans les flux de travail industriels standard. Si la promesse se confirme en production, cette démarche pourrait accélérer significativement le moment où le quantique cesse d'être un sujet de laboratoire pour devenir un outil opérationnel dans les entreprises.

OutilsOutil
1 source
GitHub Copilot adopte une facturation à la consommation
48AI News 

GitHub Copilot adopte une facturation à la consommation

À partir du 1er juin 2026, GitHub Copilot abandonne son modèle d'abonnement à requêtes fixes pour adopter une facturation à la consommation de tokens. Jusqu'à présent, les utilisateurs disposaient d'un quota mensuel de « requêtes premium », chaque requête comptant pour une unité qu'il s'agisse d'une tâche complexe de refactorisation ou d'une simple question. Le nouveau système remplace ces requêtes par des « AI Credits » : un abonné Copilot Pro à 10 dollars par mois reçoit 1 000 crédits, chaque crédit valant un centime américain. Un token représente environ les trois quarts d'un mot, ce qui signifie que 10 000 mots de code soumis à Copilot génèrent entre 12 000 et 13 000 tokens facturés. Le coût réel dépendra du modèle choisi, du ratio entrées/sorties, de la taille du cache et de la fonctionnalité utilisée. Seules les suggestions de complétion de code et les « Next Edit suggestions » resteront gratuites. Ce changement modifie profondément la relation des développeurs avec l'outil. Alors que l'abonnement mensuel masquait jusqu'ici la consommation réelle de tokens, Microsoft subventionnait de facto trois à huit fois la valeur nominale de chaque abonnement grâce à ses revenus logiciels et cloud, les utilisateurs devront désormais surveiller activement leur dépense token par requête. Pour un développeur qui enchaîne des tâches simples, l'impact sera limité. En revanche, les équipes qui déploient des agents de codage autonomes sur de grandes bases de code risquent de voir leur facture exploser rapidement. Le cas d'Uber est emblématique : selon The Information, le directeur technique de l'entreprise a déclaré avoir déjà épuisé l'intégralité du budget IA 2026 dès les premiers mois de l'année, alors que 11 % des mises à jour du code d'Uber sont désormais rédigées par des agents IA, principalement basés sur Claude d'Anthropic. Ce virage tarifaire s'inscrit dans un mouvement plus large du secteur. Anthropic et OpenAI ont déjà migré leurs clients enterprise vers une facturation à la consommation. Microsoft, propriétaire de GitHub, suit la même trajectoire mais à partir d'une position plus exposée : Copilot cible précisément les développeurs individuels et les petites équipes, un public moins préparé que les grandes entreprises à raisonner en coût par token. Le risque pour GitHub est double : freiner l'exploration des nouveaux utilisateurs, qui hésiteront avant de soumettre de longues sessions de débogage, et accélérer l'arbitrage chez les équipes tech qui compareront désormais les coûts réels de Copilot face à ses concurrents directs comme Cursor ou les offres Claude for Business. La transparence des coûts, longtemps perçue comme un avantage client, devient un terrain de compétition où les marges de chaque acteur seront exposées.

UELes développeurs français et européens utilisant GitHub Copilot devront surveiller activement leur consommation de tokens dès juin 2026 et réévaluer leurs budgets IA face à des alternatives comme Cursor ou Claude for Business.

💬 Microsoft vient de retirer le masque. Tant que le forfait fixe absorbait tout, personne ne regardait la consommation réelle, mais là, un agent autonome sur une grosse codebase, et la facture peut tripler sans prévenir. Le cas Uber, c'est pas une anecdote, c'est exactement ce qui attend les équipes qui ont dit oui à l'IA à grande échelle sans jamais compter les tokens.

OutilsOutil
1 source
Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle
49VentureBeat AI 

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

En l'espace de quelques jours fin mars 2026, trois des principaux agents de codage IA ont été compromis. Le 30 mars, le chercheur Tyler Jespersen de BeyondTrust a démontré qu'un simple nom de branche GitHub pouvait forcer Codex d'OpenAI à exfiltrer son token OAuth en clair : en injectant une sous-commande via un point-virgule et des backticks dans le paramètre de nom de branche, le script de clonage devenait un vecteur d'exfiltration. Pour masquer l'attaque, 94 caractères "Ideographic Space" (Unicode U+3000) rendaient la branche malveillante visuellement identique à "main" dans l'interface Codex. OpenAI a classé la faille Critical P1 et livré un correctif complet le 5 février 2026. Deux jours plus tard, le code source de Claude Code d'Anthropic se retrouvait sur le registre npm public. Dans la foulée, Adversa découvrait que Claude Code cessait silencieusement d'appliquer ses règles de blocage dès qu'une commande dépassait 50 sous-commandes, un compromis délibéré entre sécurité et performance. Trois CVE distincts ont touché Claude Code en parallèle : CVE-2026-25723 permettait de contourner le sandbox via des commandes chaînées sed/echo ; CVE-2026-33068 permettait à un dépôt malveillant de pré-configurer le mode bypassPermissions dans .claude/settings.json avant même que la boîte de dialogue de confiance n'apparaisse. Côté Microsoft, Johann Rehberger a prouvé que des instructions cachées dans une description de pull request pouvaient activer l'auto-approbation dans les paramètres VS Code de Copilot, accordant une exécution shell illimitée sur Windows, macOS et Linux. Orca Security a ensuite montré qu'un simple ticket GitHub suffisait à faire exfiltrer le GITHUB_TOKEN privilégié par Copilot dans GitHub Codespaces. Ce qui unit toutes ces attaques, c'est l'identique surface d'entrée : non pas le modèle de langage, mais le credential qu'il détient et qu'il utilise sans session humaine pour l'ancrer. Merritt Baer, CSO d'Enkrypt AI et ancienne Deputy CISO chez AWS, résume le problème : les entreprises croient avoir "approuvé" un fournisseur d'IA, mais elles n'ont approuvé qu'une interface, pas le système sous-jacent. Ce sont les credentials sous cette interface qui constituent la vraie surface d'attaque. Un agent compromis n'a pas besoin d'exploiter le modèle, il lui suffit d'hériter des droits d'accès de l'environnement dans lequel il s'exécute pour prendre le contrôle d'un dépôt entier. Ces incidents s'inscrivent dans une série de neuf mois commencée à Black Hat USA 2025, où Michael Bargury, CTO de Zenity, avait détourné en direct ChatGPT, Microsoft Copilot Studio, Google Gemini, Salesforce Einstein et Cursor via un MCP Jira, sans aucun clic utilisateur. Six équipes de recherche ont depuis publié des exploits contre Codex, Claude Code, Copilot et Vertex AI, tous suivant le même schéma. L'enjeu n'est plus théorique : les agents de codage sont désormais branchés sur des pipelines CI/CD réels, disposent de tokens avec des droits d'écriture sur des dépôts de production, et opèrent avec une supervision humaine minimale. Tant que l'autorisation restera aussi plate que celle d'un LLM et que les règles de sécurité pourront être contournées par un simple dépassement de seuil arbitraire, les tokens resteront la cible de choix.

UELes développeurs et entreprises européens utilisant Claude Code, GitHub Copilot ou Codex dans leurs pipelines CI/CD sont exposés à des risques de vol de tokens et de compromission de dépôts de production, nécessitant une révision immédiate des permissions accordées à ces agents IA.

💬 Trois agents, trois failles, même surface d'attaque : le token, pas le modèle. C'est un peu gênant de voir qu'on reproduit les mêmes erreurs d'OAuth mal configuré qu'il y a dix ans, juste avec plus de puissance de feu et des droits d'écriture sur des dépôts de production. On a déployé avant de comprendre, et maintenant on ramasse.

SécuritéOpinion
1 source
Voici comment se structure le nouvel accord entre Microsoft et OpenAI
50The Verge AI 

Voici comment se structure le nouvel accord entre Microsoft et OpenAI

Microsoft et OpenAI ont annoncé lundi une refonte majeure de leur accord de partenariat, mettant fin à plusieurs années d'exclusivité qui liait le déploiement des services d'OpenAI à l'infrastructure cloud Azure de Microsoft. Le changement le plus significatif autorise désormais OpenAI à proposer ses produits et services sur l'ensemble des fournisseurs cloud, ouvrant la voie à des accords avec AWS, Google Cloud ou d'autres concurrents de Microsoft. La séparation a été décrite par les deux parties comme étant remarquablement cordiale, malgré les tensions accumulées au fil des années. Ce rééquilibrage représente un tournant stratégique considérable pour l'industrie de l'IA. OpenAI gagne en indépendance et en flexibilité commerciale, pouvant désormais négocier avec n'importe quel opérateur cloud selon les besoins de ses clients. Pour Microsoft, qui a investi plusieurs milliards de dollars dans OpenAI depuis 2019, cela signifie la perte d'un avantage concurrentiel majeur, même si la relation commerciale entre les deux entreprises se poursuit sous une forme révisée. Le partenariat Microsoft-OpenAI a traversé de multiples turbulences ces dernières années : désaccords entre dirigeants, renégociations contractuelles répétées, et frustrations autour des capacités d'infrastructure nécessaires pour entraîner et déployer des modèles toujours plus puissants. L'arrivée d'OpenAI dans le statut de société à but lucratif et sa montée en puissance comme acteur autonome rendaient inévitable cette évolution vers plus d'indépendance, dans un secteur où la guerre des clouds est désormais indissociable de la course à l'IA.

UELes entreprises européennes utilisant des services d'IA générative disposent désormais d'une plus grande flexibilité pour choisir leur fournisseur cloud, réduisant la dépendance à un opérateur unique.

BusinessOpinion
1 source

Suivre Microsoft en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour