Aller au contenu principal
Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry
OutilsBlog du Modérateur13sem· 1 min de lecture

Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry

Source originale ↗·

Microsoft a intégré trois nouveaux modèles propriétaires à sa plateforme Azure AI Foundry : un modèle de transcription audio, un modèle de synthèse vocale et un modèle de traitement d'image. Ces outils, développés en interne par les équipes de recherche de la firme de Redmond, sont désormais disponibles pour les développeurs et entreprises via l'interface Foundry, la plateforme centralisée de Microsoft pour déployer et tester des modèles d'IA.

Cette initiative marque une étape significative dans la stratégie de diversification de Microsoft, qui cherche à réduire sa dépendance technologique à l'égard d'OpenAI, son partenaire de référence depuis l'investissement massif de 13 milliards de dollars. En proposant ses propres modèles spécialisés sur des tâches précises comme la transcription ou la reconnaissance visuelle, Microsoft offre aux entreprises clientes des alternatives intégrées à l'écosystème Azure, potentiellement moins coûteuses et plus facilement personnalisables.

Cette évolution s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent toutes à maîtriser leur chaîne de valeur IA de bout en bout. Google avec Gemini, Amazon avec Titan et Nova, et désormais Microsoft avec ses modèles maison renforcent chacun leurs capacités propriétaires, réduisant le pouvoir de négociation des fournisseurs tiers et consolidant leur emprise sur les entreprises qui bâtissent sur leur infrastructure.

Impact France/UE

Les entreprises européennes sur Azure AI Foundry disposent désormais de modèles propriétaires Microsoft pour la transcription, la synthèse vocale et l'image, comme alternatives intégrées aux solutions OpenAI.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels
1AI Business 

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels

Microsoft franchit une nouvelle étape dans le développement de ses propres modèles d'intelligence artificielle en annonçant des systèmes dédiés à la voix et à l'image, allant au-delà des grands modèles de langage textuels sur lesquels la firme de Redmond s'est largement appuyée jusqu'ici. Cette initiative marque une volonté affichée de maîtriser l'ensemble de la chaîne des capacités d'IA, plutôt que de sous-traiter ces briques à des partenaires externes. L'enjeu est considérable pour l'industrie : en développant ses propres modèles vocaux et visuels, Microsoft réduit sa dépendance vis-à-vis d'OpenAI, dont il est le principal investisseur et distributeur via Azure. Cela lui permettrait de proposer des solutions plus intégrées, moins coûteuses et plus personnalisables pour ses clients entreprises, tout en gardant la main sur la roadmap technologique de ses produits phares comme Copilot. Cette évolution s'inscrit dans une tendance plus large de verticalisation de l'IA au sein des grandes plateformes technologiques : Google, Apple et Amazon ont chacun suivi une trajectoire similaire. La relation entre Microsoft et OpenAI, longtemps présentée comme un partenariat exclusif, montre ainsi ses limites stratégiques à mesure que l'IA devient un avantage concurrentiel central. La course à la souveraineté sur les modèles fondamentaux ne fait que commencer.

UELes entreprises françaises et européennes utilisant Azure pourraient accéder à des modèles vocaux et visuels plus intégrés et compétitifs, réduisant leur dépendance indirecte à OpenAI.

OutilsOpinion
1 source
Microsoft déploie Copilot Cowork plus largement et permet aux modèles d'IA de vérifier mutuellement leur travail
2The Decoder 

Microsoft déploie Copilot Cowork plus largement et permet aux modèles d'IA de vérifier mutuellement leur travail

Microsoft déploie plus largement « Cowork », une nouvelle fonctionnalité de Microsoft 365 Copilot capable de gérer des flux de travail complets de manière autonome. L'outil, annoncé lors d'un déploiement progressif auprès des utilisateurs entreprise, permet à l'assistant IA de prendre en charge des tâches de bout en bout — de la recherche à la rédaction — sans intervention humaine à chaque étape. Parallèlement, Microsoft introduit un mécanisme de vérification croisée où plusieurs modèles d'IA s'évaluent mutuellement, dans le cadre d'un nouvel outil de recherche intégré à la suite. Ce double mouvement marque une évolution significative dans la manière dont les outils de productivité intègrent l'IA générative. Jusqu'ici, Copilot intervenait principalement en assistance ponctuelle — suggérer, reformuler, résumer. Avec Cowork, la logique bascule vers l'autonomie : l'IA devient un collaborateur capable d'orchestrer un projet entier. La vérification inter-modèles, elle, vise à réduire les hallucinations et améliorer la fiabilité des réponses, un problème central pour les déploiements en entreprise où les erreurs ont des conséquences réelles. Microsoft s'inscrit dans une course effrénée entre les grandes plateformes pour transformer leurs suites professionnelles en environnements agentiques. Google avec Workspace, Salesforce avec Agentforce, ou encore Notion — tous misent sur des agents capables d'agir, pas seulement de répondre. Pour Microsoft, qui a investi massivement dans OpenAI et intégré Copilot dans l'ensemble de sa suite M365, Cowork représente la concrétisation de cette ambition : faire de l'IA un véritable membre de l'équipe plutôt qu'un simple assistant à la demande.

UEMicrosoft 365 étant massivement déployé dans les entreprises européennes, l'autonomisation accrue de Copilot soulève des questions de conformité et de supervision humaine au regard des exigences de l'AI Act pour les systèmes agentiques.

OutilsOutil
1 source
Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides
3MarkTechPost 

Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides

Microsoft a dévoilé la semaine dernière MAI-Transcribe-1.5, la deuxième génération de son modèle de reconnaissance vocale développé en interne. Ce système de transcription automatique prend en charge 43 langues, contre 25 pour la version précédente, avec dix-huit nouvelles langues ajoutées sans dégradation des performances, dont le bengali, le tamoul, le télougou côté Asie du Sud, et l'ukrainien, le grec ou le catalan côté Europe. Sur le benchmark multilingue FLEURS, Microsoft revendique la première place parmi les modèles du marché. Sur le classement Artificial Analysis, le modèle affiche un taux d'erreur par mot (WER) de 2,4 %, ce qui le place troisième dans un champ concurrentiel. En vitesse, il est capable de transcrire une heure d'audio en moins de 15 secondes et se révèle jusqu'à 5 fois plus rapide que des modèles comparables comme Gemini 3.1, Scribe v2 ou GPT-4o-Transcribe sur des fichiers longs. MAI-Transcribe-1.5 est intégré à Copilot, Teams, GitHub et Dynamics 365 Contact Centre, et disponible via Foundry, la plateforme de modèles de Microsoft. La fonctionnalité qui mérite le plus d'attention est le « keyword biasing », ou biais par entités nommées. Les transcripteurs génériques trébuchent régulièrement sur les vocabulaires métiers, noms propres, termes médicaux, acronymes internes, précisément là où les erreurs coûtent le plus cher. MAI-Transcribe-1.5 permet de fournir jusqu'à 200 mots-clés personnalisés que le modèle prend en compte lors de la transcription, sans forcer mécaniquement les correspondances mais en s'appuyant sur le contexte. Résultat : une réduction de 30 % du WER sur FLEURS lorsque ce mécanisme est activé. Sur les réunions d'entreprise, dans les centres d'appels ou les environnements de santé, cette capacité change concrètement la qualité des transcriptions produites. La détection automatique de la langue parlée, sans paramétrage manuel, complète l'ensemble pour des flux d'entrée non structurés. La course aux modèles de transcription s'est considérablement intensifiée depuis que OpenAI a popularisé Whisper et que des acteurs comme AssemblyAI ou ElevenLabs ont investi le segment entreprise. Microsoft, fort de son infrastructure Azure et de son intégration profonde dans les outils de productivité, cherche à imposer une solution maison plutôt que de dépendre de fournisseurs tiers. Le passage de 25 à 43 langues, avec une couverture renforcée des langues d'Asie du Sud, reflète aussi une ambition de croissance sur des marchés où l'anglais n'est pas dominant. Pour les équipes qui traitent des archives audio volumineuses en batch, médias, justice, santé, support client, un facteur de vitesse de 5x sur les fichiers longs n'est pas anecdotique : il réduit directement les coûts d'infrastructure et les délais de traitement à grande échelle.

UELes entreprises européennes intégrées à l'écosystème Microsoft (Teams, Dynamics 365) bénéficieront directement de ces gains de précision et de vitesse, avec un support renforcé des langues européennes comme le grec, le catalan et l'ukrainien.

OutilsOpinion
1 source
GPT-5.5 débarque dans Microsoft 365 : la fin du travail manuel approche?
4Le Big Data 

GPT-5.5 débarque dans Microsoft 365 : la fin du travail manuel approche?

Depuis le 27 avril 2026, GPT-5.5 Thinking, la dernière version du modèle d'OpenAI, est déployé au sein de Microsoft 365 Copilot. Le modèle est disponible dans Copilot Chat, Word, Excel et PowerPoint, ainsi que dans Copilot Studio. Cette intégration ne se limite pas au moteur de génération de texte : Microsoft lance simultanément ChatGPT Images 2.0, un outil de création visuelle directement accessible dans PowerPoint, avec une extension prochaine à Copilot Chat. L'ensemble repose sur une couche contextuelle baptisée Work IQ, qui ajuste les réponses de l'IA en fonction du contexte de travail de l'utilisateur, de ses fichiers, de ses habitudes et de ses tâches en cours. Ce déploiement marque un saut qualitatif pour Copilot, qui passe d'un assistant réactif à un outil capable de structurer des tâches complexes en plusieurs étapes logiques, d'anticiper les besoins et de produire des résultats plus complets et mieux argumentés. Pour les entreprises abonnées à Microsoft 365, cela signifie concrètement que la rédaction de rapports, l'analyse de données dans Excel ou la construction de présentations dans PowerPoint peuvent désormais être prises en charge de bout en bout par l'IA, sans recours à des outils tiers. La suppression de cette friction entre plusieurs plateformes représente un gain de productivité direct, mais renforce aussi la dépendance à l'écosystème fermé de Microsoft. Cette intégration s'inscrit dans une course à l'arme IA dans les logiciels de productivité qui oppose Microsoft à Google (Workspace avec Gemini) et à des acteurs émergents comme Notion ou Slack. OpenAI, dont Microsoft est le principal investisseur avec plus de 13 milliards de dollars engagés, positionne GPT-5.5 comme un modèle de raisonnement avancé, distinct des versions précédentes par sa capacité à enchaîner des étapes de réflexion plutôt que de simplement générer du texte. La dimension Work IQ, en personnalisant les sorties selon le contexte professionnel, vise à répondre à la critique récurrente faite aux copilotes IA : leur manque de pertinence situationnelle. Si ces promesses tiennent à l'usage, la frontière entre l'assistant et le collaborateur autonome continue de se déplacer, redessinant progressivement les compétences attendues des travailleurs du savoir.

UELes entreprises françaises et européennes abonnées à Microsoft 365 accèdent désormais à GPT-5.5 directement dans Word, Excel et PowerPoint, ce qui renforce leur dépendance à l'écosystème Microsoft/OpenAI et soulève des enjeux de souveraineté numérique au regard du RGPD.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic