Aller au contenu principal
Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI
LLMsLatent Space1h

Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI

Résumé IASource uniqueImpact UE
Source originale ↗·

Lors de la conférence Microsoft Build des 1er et 2 juin 2026, Satya Nadella et Mustafa Suleyman ont annoncé le lancement de sept nouveaux modèles d'intelligence artificielle sous la bannière MAI, la division IA interne de Microsoft. La famille comprend MAI-Thinking-1, le modèle phare de raisonnement, ainsi que MAI-Code-1-Flash pour la génération de code, MAI-Image-2.5 pour la vision, MAI-Transcribe-1.5 pour la transcription vocale et MAI-Voice-2 pour la synthèse vocale. MAI-Thinking-1 est une architecture MoE (Mixture of Experts) de 35 milliards de paramètres actifs, avec une fenêtre de contexte de 256 000 tokens, pré-entraîné sur 30 000 milliards de tokens grâce à 8 192 GPU GB200. Le modèle atteint 97 % sur le benchmark AIME 2025 et 53 % sur SWE-Bench Pro. Microsoft a également publié un rapport technique de 109 pages détaillant son architecture, saluée par la communauté de recherche pour son niveau de transparence inhabituel.

Ces annonces marquent une étape significative pour Microsoft, qui se positionne désormais non plus seulement comme plateforme IA mais comme laboratoire de frontier models à part entière. Le fait que MAI-Thinking-1 ait été entraîné sans distillation à partir de modèles tiers, contrairement à de nombreux modèles concurrents, lui confère une crédibilité technique particulière. Des évaluateurs humains indépendants sur la plateforme Surge ont préféré ce modèle à Claude Sonnet 4.6 d'Anthropic dans des tests en aveugle. Pour les entreprises, cette offre ouvre la voie à des fine-tuning spécialisés dans des domaines précis, un créneau que les laboratoires frontier comme OpenAI ou Google ont progressivement abandonné. L'annonce de Web IQ, une nouvelle couche API de recherche et d'ancrage pour agents IA que Microsoft revendique déjà au cœur de "presque tous les agents et chatbots de l'industrie, y compris Copilot et ChatGPT", renforce cette ambition de devenir l'infrastructure invisible de l'IA d'entreprise.

Microsoft AI, anciennement connue sous le nom d'Inflection AI après son rachat en 2024, n'existe que depuis deux ans sous cette forme. Le fait qu'elle produise des modèles entraînés de zéro à ce niveau de performance illustre la rapidité de montée en puissance possible avec des ressources computationnelles massives. Build 2026 a également mis en avant GitHub Copilot repositionné comme environnement de développement natif pour agents, une nouvelle Surface RTX Spark Dev Box, et des projets hardware conceptuels comme Solara et Scout. Mustafa Suleyman a décrit Microsoft comme une "machine à escalader des collines", ce qui traduit une stratégie d'amélioration continue et méthodique plutôt que des percées spectaculaires. La prochaine étape sera de voir si MAI-Thinking-1 tient ses promesses dans des déploiements réels, et si Microsoft parvient à convaincre l'écosystème de développeurs de s'appuyer sur ses modèles plutôt que ceux d'OpenAI, dont il reste paradoxalement l'un des principaux investisseurs.

Impact France/UE

Les entreprises européennes sur Azure peuvent accéder aux modèles MAI et à l'API Web IQ pour leurs agents IA, réduisant potentiellement leur dépendance aux modèles OpenAI.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Microsoft lancera un nouveau modèle de code la semaine prochaine
1The Information AI 

Microsoft lancera un nouveau modèle de code la semaine prochaine

Microsoft s'apprête à dévoiler une gamme de nouveaux modèles d'intelligence artificielle développés en interne lors de sa conférence annuelle Build, prévue la semaine prochaine à San Francisco. Parmi les annonces attendues figure un modèle spécialisé dans la génération de code, conçu pour renforcer GitHub Copilot, l'assistant de programmation appartenant à Microsoft. L'entreprise prévoit également de présenter plusieurs modèles déclinés en différentes tailles, chacun optimisé pour des tâches spécifiques : transcription audio, raisonnement, synthèse vocale et traitement d'images. Cette famille de modèles s'inscrit dans la continuité des premiers modèles maison que Microsoft avait présentés en avant-première plus tôt cette année. L'enjeu est considérable pour GitHub Copilot, qui avait pourtant pris une longueur d'avance significative sur le marché des assistants de codage alimentés par l'IA. Cet avantage s'est progressivement érodé face à la montée en puissance de concurrents comme Cursor et Claude Code d'Anthropic, qui ont su séduire une large communauté de développeurs. Microsoft cherche donc à reconquérir ce terrain perdu en proposant des modèles plus performants et mieux adaptés aux besoins concrets des programmeurs. La capacité à regagner la confiance de cette communauté représente un test majeur pour la crédibilité de la stratégie IA de la firme de Redmond. Cette initiative s'inscrit dans un contexte de compétition intense entre les grands acteurs de la technologie pour s'imposer auprès des développeurs, qui constituent un segment stratégique dans l'adoption des outils d'IA. Microsoft, qui a investi massivement dans OpenAI, cherche en parallèle à développer ses propres capacités pour réduire sa dépendance à des partenaires externes. La conférence Build est traditionnellement le moment choisi par l'entreprise pour annoncer ses ambitions en matière de plateforme et d'outillage. La montée en puissance des cas d'usage liés à la voix et à la transcription, de plus en plus plébiscités par les développeurs, explique par ailleurs pourquoi Microsoft intègre ces capacités dès le lancement de cette nouvelle famille de modèles.

UELes développeurs européens et français utilisant GitHub Copilot pourraient bénéficier de modèles maison Microsoft plus performants, dans un marché des assistants de codage de plus en plus concurrentiel face à Cursor et autres outils.

💬 Copilot s'est fait dépasser par Cursor et Claude Code, et Microsoft le sait très bien. Ce qui m'intéresse là-dedans, c'est moins le modèle code en lui-même que la volonté de réduire la dépendance à OpenAI, parce qu'investir des milliards dans un partenaire et lui laisser le cerveau de ton produit phare, c'est un pari bizarre. Regagner la confiance des devs, ça ne se décrète pas avec une annonce à Build.

LLMsActu
1 source
Google lance la famille de modèles ouverts Gemma 4
2AI Business 

Google lance la famille de modèles ouverts Gemma 4

Google a lancé Gemma 4, une nouvelle famille de modèles d'IA open source conçue pour le raisonnement avancé et les capacités multimodales. Héritière de la série Gemma, cette offre s'inscrit dans la stratégie de Google DeepMind de proposer des modèles accessibles aux développeurs et chercheurs, utilisables localement ou dans le cloud. La famille comprend plusieurs variantes de tailles différentes, adaptées à des usages allant des appareils mobiles aux serveurs de production. L'arrivée de Gemma 4 renforce l'arsenal open source disponible pour les équipes techniques qui ne veulent pas dépendre exclusivement de modèles propriétaires via API. Les capacités multimodales — traitement combiné de texte et d'images — ouvrent la voie à des applications concrètes dans l'analyse documentaire, la vision par ordinateur et les assistants enrichis. Pour les entreprises soucieuses de confidentialité ou de coûts d'inférence, un modèle performant déployable en local représente un avantage opérationnel direct. Google s'inscrit ainsi dans une compétition ouverte avec Meta (LLaMA), Mistral et d'autres acteurs qui misent sur l'open source pour gagner l'adhésion des développeurs. La série Gemma, lancée début 2024, avait déjà rencontré un accueil favorable grâce à ses performances compétitives à taille réduite. Avec Gemma 4, Google cherche à consolider sa position dans cet écosystème, alors que le débat entre modèles ouverts et fermés reste central dans l'industrie de l'IA.

UELes équipes techniques et entreprises européennes disposent d'une nouvelle famille open source déployable en local, réduisant la dépendance aux APIs propriétaires et facilitant la conformité RGPD.

LLMsOpinion
1 source
Microsoft AI lance Harrier-OSS-v1 : une nouvelle famille de modèles d'embeddings multilingues atteignant l'état de l'art sur Multilingual MTEB v2
3MarkTechPost 

Microsoft AI lance Harrier-OSS-v1 : une nouvelle famille de modèles d'embeddings multilingues atteignant l'état de l'art sur Multilingual MTEB v2

Microsoft a publié Harrier-OSS-v1, une famille de trois modèles d'embedding de texte multilingues qui décrochent les meilleurs scores du moment sur le benchmark Multilingual MTEB v2, la référence principale pour évaluer la qualité des représentations vectorielles de texte. La famille comprend trois variantes : un modèle de 270 millions de paramètres, un de 0,6 milliard, et un de 27 milliards. Tous trois partagent une fenêtre de contexte de 32 768 tokens — soit entre 32 et 64 fois celle des modèles classiques comme les dérivés de BERT — et produisent des embeddings de dimensions variables (1 024, 2 048 ou 5 376 selon la taille). Les modèles sont disponibles en open source sur HuggingFace. Ce lancement représente une rupture technique notable dans le domaine des embeddings. Contrairement aux architectures encodeur bidirectionnelles qui dominent ce secteur depuis BERT en 2018, Harrier repose sur une architecture décodeur-seulement, identique à celle des grands modèles de langage modernes. Pour obtenir un vecteur représentatif d'un texte entier, le modèle utilise le mécanisme de last-token pooling : l'état caché du dernier token de la séquence sert de représentation agrégée, puis est normalisé. La fenêtre de 32k tokens est particulièrement précieuse pour les systèmes RAG (Retrieval-Augmented Generation), où l'obligation de découper de longs documents en petits morceaux dégrade souvent la cohérence sémantique. Par ailleurs, les modèles plus petits (270M et 0,6B) ont été entraînés par distillation de connaissance à partir de modèles enseignants plus grands, leur permettant d'atteindre des performances supérieures à ce que leur taille laisserait espérer — un avantage concret pour les déploiements contraints en mémoire ou en latence. La course aux embeddings multilingues s'intensifie depuis que les applications RAG et la recherche sémantique sont devenues des composantes centrales des produits IA en entreprise. Microsoft entre sur ce terrain avec une approche instruction-tuned : pour obtenir les performances annoncées, chaque requête doit être précédée d'une instruction décrivant la tâche (par exemple, "Retrieve semantically similar text"), tandis que les documents sont encodés sans instruction. Ce design permet au modèle d'adapter dynamiquement son espace vectoriel selon le cas d'usage — recherche web, mining de traductions, classification. Face à des concurrents comme Cohere, Voyage AI ou les modèles E5 de Microsoft lui-même, Harrier-OSS-v1 se positionne comme une option open source sérieuse couvrant une gamme de tailles adaptée à des contraintes très différentes, du serveur embarqué au cluster GPU haute capacité.

UELes modèles open source multilingues couvrant les langues européennes permettent aux équipes R&D et entreprises de déployer des systèmes RAG performants sans dépendance à une API propriétaire.

LLMsActu
1 source
Nouveaux modèles d’IA, Windows repensé… Microsoft prépare du lourd pour Build 2026
4Le Big Data 

Nouveaux modèles d’IA, Windows repensé… Microsoft prépare du lourd pour Build 2026

Microsoft tiendra sa conférence annuelle Build 2026 dans les prochaines semaines, et les premières fuites dessinent un programme particulièrement dense. L'entreprise préparerait le lancement d'un nouveau modèle de raisonnement développé en interne par Microsoft AI, distinct des modèles génératifs classiques : conçu pour analyser les problèmes complexes, il produirait des réponses plus structurées et plus fiables sur des tâches de logique ou de planification. Copilot, l'assistant omnipresent de Microsoft, devrait lui aussi évoluer vers une version plus ambitieuse, décrite en interne comme une "super application" consolidant l'ensemble des services de l'écosystème Microsoft dans une interface unique. Côté Windows 11, plusieurs nouveautés sont attendues : amélioration des performances, réécriture de composants système pour gagner en réactivité, et une expérience dédiée aux développeurs avec des outils préinstallés, des scripts prêts à l'emploi et un environnement simplifié dès le démarrage. Ces annonces interviennent à un moment charnière pour Microsoft. La firme de Redmond a massivement investi dans l'IA depuis son partenariat avec OpenAI, mais doit maintenant prouver que ces investissements se traduisent en produits concrets et différenciants. Le nouveau modèle de raisonnement signalerait une volonté de ne plus dépendre uniquement des modèles OpenAI, en développant ses propres capacités maison. L'évolution de Copilot en point d'entrée universel de l'écosystème Microsoft représente un enjeu commercial majeur : si l'assistant devient la porte d'accès à Microsoft 365, Azure, Teams et Windows, c'est toute la fidélisation client qui se joue à travers lui. Pour les développeurs, une expérience Windows rationalisée peut réduire les frictions d'installation et de configuration, un argument de poids face à la popularité persistante de Linux et macOS dans ce segment. Build est historiquement la conférence où Microsoft trace sa feuille de route technique pour les douze mois suivants, et cette édition 2026 s'inscrit dans une compétition exacerbée avec Google, Apple et les acteurs purement IA comme Anthropic ou xAI. Microsoft doit également préparer Windows à la nouvelle génération de puces spécialisées pour l'IA, les NPU intégrés aux processeurs ARM et x86 récents, qui permettent d'exécuter des modèles localement sans passer par le cloud. La capacité du système à tirer parti de ce matériel sera déterminante pour les usages IA embarqués. Si les annonces tiennent leurs promesses, Build 2026 pourrait marquer un tournant réel pour Windows, qui n'a pas connu de refonte en profondeur depuis le passage à Windows 11 en 2021, les développeurs, eux, attendent des démonstrations avant de se laisser convaincre.

UELes entreprises européennes sous Microsoft 365 et Windows seraient directement concernées par l'intégration de capacités IA locales via NPU et l'évolution de Copilot en point d'entrée universel de l'écosystème.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour