Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry
Microsoft a intégré trois nouveaux modèles propriétaires à sa plateforme Azure AI Foundry : un modèle de transcription audio, un modèle de synthèse vocale et un modèle de traitement d'image. Ces outils, développés en interne par les équipes de recherche de la firme de Redmond, sont désormais disponibles pour les développeurs et entreprises via l'interface Foundry, la plateforme centralisée de Microsoft pour déployer et tester des modèles d'IA.
Cette initiative marque une étape significative dans la stratégie de diversification de Microsoft, qui cherche à réduire sa dépendance technologique à l'égard d'OpenAI, son partenaire de référence depuis l'investissement massif de 13 milliards de dollars. En proposant ses propres modèles spécialisés sur des tâches précises comme la transcription ou la reconnaissance visuelle, Microsoft offre aux entreprises clientes des alternatives intégrées à l'écosystème Azure, potentiellement moins coûteuses et plus facilement personnalisables.
Cette évolution s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent toutes à maîtriser leur chaîne de valeur IA de bout en bout. Google avec Gemini, Amazon avec Titan et Nova, et désormais Microsoft avec ses modèles maison renforcent chacun leurs capacités propriétaires, réduisant le pouvoir de négociation des fournisseurs tiers et consolidant leur emprise sur les entreprises qui bâtissent sur leur infrastructure.
Les entreprises européennes sur Azure AI Foundry disposent désormais de modèles propriétaires Microsoft pour la transcription, la synthèse vocale et l'image, comme alternatives intégrées aux solutions OpenAI.