Aller au contenu principal
OVHcloud veut ses Mistral gagnants et se lance dans les LLM
LLMsNext INpact2h· 2 min de lecture

OVHcloud veut ses Mistral gagnants et se lance dans les LLM

Source originale ↗·

OVHcloud, le géant européen de l'hébergement basé à Roubaix, a annoncé lors du salon VivaTech son intention de lancer sa propre famille de modèles de langage (LLM). Octave Klaba, qui a repris la direction de l'entreprise fin 2025, a confirmé l'ambition à Reuters : sans maîtrise de cette technologie, OVHcloud ne pourrait « pas garantir son avenir ». Le groupe prévoit de déployer plusieurs modèles couvrant différents cas d'usage, sur le modèle d'Anthropic avec Opus, Sonnet et Haiku, ou d'OpenAI avec ses gammes GPT et o. La piste open source est explicitement envisagée, Klaba précisant que l'entreprise « regardera à quel moment elle sera suffisamment bonne pour open sourcer » ses modèles. Le budget estimé pour ce projet se situe entre 150 et 200 millions d'euros, contre environ un milliard il y a quelques années, grâce à la chute des coûts d'entraînement.

Ce virage marque une montée en puissance significative pour OVHcloud, qui ne se positionne plus seulement comme fournisseur d'infrastructure mais comme acteur de la couche modèle, territoire jusqu'ici dominé par OpenAI, Anthropic et Mistral. Pour les entreprises européennes soucieuses de souveraineté numérique, l'émergence d'un LLM made in Europe, hébergé et entraîné sur sol européen, représente une alternative crédible aux géants américains. La qualification « et de l'IA » ajoutée récemment à tous les communiqués de presse d'OVHcloud signale que ce changement de positionnement est déjà assumé en interne, bien avant la sortie d'un premier modèle.

Pour préparer ce lancement, OVHcloud a mené une série d'acquisitions ciblées depuis le début de l'année. En janvier, le groupe a racheté Seald, startup française spécialisée dans le chiffrement bout en bout, dont le SDK bénéficie d'un visa de sécurité CSPN délivré par l'ANSSI. En mars, c'est Dragon LLM qui a rejoint le giron, société française dédiée aux modèles souverains et spécialisés. Plus récemment, OVHcloud est entré en négociations exclusives pour acquérir Gladia, spécialisée dans l'IA vocale. Ces rachats s'accompagnent d'un renforcement des équipes internes en fine-tuning, la technique permettant de spécialiser un modèle pré-entraîné sur des tâches précises. La principale inconnue reste l'approvisionnement en GPU : Klaba a lui-même comparé les puces Nvidia à des fraises qui « pourrissent le lendemain », tant leur cycle de dépréciation est rapide face aux nouvelles générations. Entraîner des modèles compétitifs en exige des volumes importants, et la question de la rentabilité de ces investissements matériels reste entière.

Impact France/UE

OVHcloud, premier hébergeur européen basé à Roubaix, se positionne comme futur fournisseur de LLMs souverains entraînés et hébergés sur sol européen, offrant aux entreprises et institutions françaises une alternative concrète aux modèles américains pour répondre aux exigences de souveraineté numérique et de conformité réglementaire.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Mistral AI lance des agents distants dans Vibe et Mistral Medium 3.5 avec un score de 77,6 % sur SWE-Bench Verified
1MarkTechPost 

Mistral AI lance des agents distants dans Vibe et Mistral Medium 3.5 avec un score de 77,6 % sur SWE-Bench Verified

Mistral AI vient d'annoncer deux avancées majeures : le lancement des agents distants dans Vibe, sa plateforme d'agents de codage, et la mise en préversion publique de Mistral Medium 3.5, un nouveau modèle dense de 128 milliards de paramètres. Ce modèle devient immédiatement le modèle par défaut dans Vibe et dans Le Chat, l'assistant grand public de Mistral. Sur le benchmark SWE-Bench Verified, référence du secteur pour évaluer la capacité d'un modèle à résoudre des problèmes réels tirés de dépôts GitHub open source, Medium 3.5 obtient un score de 77,6%, devançant Devstral 2 ainsi que Qwen3.5 397B A17B. Le modèle dispose d'une fenêtre de contexte de 256 000 tokens, soit environ 200 000 mots traités en une seule passe, suffisant pour raisonner sur l'intégralité d'une grande base de code. Il est également multimodal, avec un encodeur visuel développé intégralement par Mistral plutôt que réutilisé depuis des modèles comme CLIP, ce qui lui confère davantage de flexibilité face aux images de tailles et formats variés. La bascule vers les agents distants représente un changement fondamental dans la façon dont les développeurs interagissent avec Vibe. Jusqu'ici, les sessions Vibe s'exécutaient localement, liant l'agent au terminal de l'utilisateur. Désormais, plusieurs sessions peuvent tourner en parallèle dans le cloud pendant que le développeur fait autre chose. Il est même possible de "téléporter" une session locale en cours vers le cloud sans perdre l'historique, l'état de la tâche ni les validations en attente. Chaque session s'exécute dans un environnement isolé, et lorsqu'une tâche est terminée, l'agent peut ouvrir directement une pull request sur GitHub et notifier le développeur. Les intégrations couvrent également Linear, Jira pour la gestion des tickets, Sentry pour les incidents, et Slack ou Teams pour les notifications. Le Chat de Mistral bénéficie de la même infrastructure via les Workflows de Mistral Studio, la même couche d'orchestration développée en interne avant d'être ouverte aux entreprises puis au grand public. Cette annonce s'inscrit dans une compétition de plus en plus dense sur le segment des agents de codage, où Mistral affronte notamment GitHub Copilot Workspace, Cursor et des offres d'OpenAI ou d'Anthropic. En positionnant Vibe comme une alternative accessible depuis la ligne de commande ou directement depuis Le Chat, Mistral mise sur la praticité et l'intégration native à la chaîne de développement existante. Le choix de construire son propre encodeur visuel plutôt que de s'appuyer sur des composants standard témoigne d'une volonté de maîtrise technique complète sur la pile. Avec Medium 3.5, Mistral qualifie ce modèle de premier "flagship merged model", suggérant une évolution de sa stratégie produit vers des modèles unifiés capables de couvrir instruction, raisonnement et code sans multiplication des variantes spécialisées.

UEMistral AI, entreprise française, consolide sa position de champion européen de l'IA avec un modèle de pointe et une plateforme d'agents de codage qui concurrencent directement les offres américaines sur le marché du développement logiciel.

LLMsOpinion
1 source
Voxtral : Mistral lance son premier modèle TTS open-weight, capable de cloner une voix en trois secondes dans neuf langues
2The Decoder 

Voxtral : Mistral lance son premier modèle TTS open-weight, capable de cloner une voix en trois secondes dans neuf langues

Mistral, la startup française spécialisée dans l'intelligence artificielle, a lancé Voxtral TTS, son premier modèle de synthèse vocale à poids ouverts. Ce modèle prend en charge neuf langues et est capable de cloner une voix à partir de seulement trois secondes d'audio. Voxtral marque une première incursion de Mistral dans le domaine de la voix, un secteur jusqu'ici dominé par des acteurs comme ElevenLabs, OpenAI ou encore Google. La capacité de clonage vocal en quelques secondes représente un saut technique significatif, rendant la personnalisation vocale accessible à moindre coût et sans infrastructure lourde. Pour les développeurs et entreprises, cela ouvre la voie à des assistants vocaux, des outils d'accessibilité ou des expériences de narration personnalisées déployables rapidement. Le fait que le modèle soit open-weight signifie qu'il peut être utilisé, modifié et hébergé localement, sans dépendance à une API propriétaire — un avantage concurrentiel majeur face aux solutions fermées. Mistral s'est imposé depuis 2023 comme l'un des rares acteurs européens capables de rivaliser avec les géants américains sur les modèles de langage ouverts. Avec Voxtral, la société étend son empreinte à la modalité audio, dans un contexte où la voix devient un vecteur central des interfaces IA. La question du clonage vocal soulève également des enjeux éthiques et réglementaires importants — notamment en matière de deepfakes audio — que Mistral devra adresser à mesure que le modèle gagne en adoption.

UEMistral, startup française, étend sa compétitivité à la synthèse vocale open-weight, renforçant l'autonomie technologique européenne face aux solutions propriétaires américaines.

LLMsActu
1 source
Mistral : Voxtral TTS, Forge, Leanstral et l'avenir de Mistral 4 — avec Pavan Kumar Reddy et Guillaume Lample
3Latent Space 

Mistral : Voxtral TTS, Forge, Leanstral et l'avenir de Mistral 4 — avec Pavan Kumar Reddy et Guillaume Lample

Mistral AI a lancé cette semaine Voxtral TTS, son premier modèle de synthèse vocale (text-to-speech), marquant une nouvelle étape dans l'expansion rapide de la startup française. Basé sur une version 4 milliards de paramètres de Ministral, ce modèle multilingue supporte neuf langues et se distingue par sa faible latence, ce qui le rend adapté aux applications temps réel. Les benchmarks internes indiquent un taux de victoire de 68,4 % face à ElevenLabs Flash v2.5 — l'une des références du secteur — tout en étant commercialisé à une fraction du coût des concurrents. Le modèle est publié en open weights, ce qui signifie que n'importe qui peut le télécharger et l'exécuter localement. L'annonce a été faite par Guillaume Lample, co-fondateur et Chief Scientist de Mistral, et Pavan Kumar Reddy, responsable de la recherche audio, lors d'une apparition dans le podcast Latent Space. L'impact de ce lancement dépasse la simple performance technique. En proposant un modèle TTS de qualité comparable à ElevenLabs — longtemps considéré comme le gold standard du secteur — mais à coût réduit et en open source, Mistral redéfinit l'accès à la synthèse vocale professionnelle. Les entreprises qui intégraient jusqu'ici des APIs vocales propriétaires peuvent désormais envisager des alternatives autohébergées, réduisant leur dépendance et leurs coûts. Pour les développeurs d'agents vocaux temps réel — un marché en forte croissance — le couple latence faible / open weights est particulièrement attractif. La dimension privacy est également centrale : déployer le modèle en local permet de traiter de l'audio sensible sans transmettre de données à des services tiers. L'architecture de Voxtral TTS est elle-même une contribution de recherche notable. Mistral a développé en interne une approche originale combinant génération auto-régressive de tokens sémantiques avec du flow matching pour les tokens acoustiques — une technique empruntée au domaine de la génération d'images, rarement appliquée à l'audio. L'entreprise a également conçu son propre codec neural audio. Ce lancement s'inscrit dans une dynamique soutenue : Mistral avait déjà publié un premier modèle audio, Voxtral ASR, pour la transcription multilingue, ainsi que des mises à jour ajoutant du context biasing, du timestamping et de la transcription en streaming. Rappelons que Mistral a levé la plus grande série de financement de l'histoire de l'IA européenne en 2024, et enchaîne les sorties de modèles à un rythme difficile à suivre. Avec Voxtral TTS, la startup confirme son ambition de couvrir l'ensemble de la pile IA — texte, code, vision, et désormais voix — tout en maintenant un positionnement open weights distinctif face aux géants américains.

UEMistral, startup française leader de l'IA européenne, propose une alternative open weights aux APIs vocales propriétaires américaines, permettant aux entreprises françaises et européennes de déployer la synthèse vocale en local sans dépendance à des services tiers.

💬 Un modèle TTS open weights qui bat ElevenLabs sur la latence et coûte une fraction du prix, c'est exactement le genre de sortie qui va faire mal à des acteurs qui vivaient sur leur avance technique. Ce qui m'intéresse surtout, c'est l'archi : du flow matching pour les tokens acoustiques, emprunté à la génération d'image, c'est un pari de recherche pas évident et visiblement ça paye. Reste à voir ce que ça donne en prod sur des cas limites, mais Mistral est en train de couvrir toute la pile et ça commence à devenir sérieux.

LLMsOpinion
1 source
Mistral AI lance un modèle de synthèse vocale qui surpasse ElevenLabs, disponible en open source
4VentureBeat AI 

Mistral AI lance un modèle de synthèse vocale qui surpasse ElevenLabs, disponible en open source

Mistral AI a lancé jeudi matin Voxtral TTS, son premier modèle de synthèse vocale de qualité frontier, avec une particularité radicale : les poids du modèle sont publiés en open source, téléchargeables et utilisables sans jamais envoyer le moindre audio vers un serveur tiers. La startup parisienne, valorisée 13,8 milliards de dollars après une levée de 2 milliards en série C menée par le fabricant de puces néerlandais ASML en septembre dernier, affirme que son modèle surpasse ElevenLabs sur les benchmarks de qualité vocale. Techniquement, Voxtral TTS repose sur trois composants : un transformeur décodeur de 3,4 milliards de paramètres, un transformeur acoustique de 390 millions de paramètres basé sur le flow-matching, et un codec audio neuronal de 300 millions de paramètres développé en interne. Le tout tient en 3 gigaoctets de RAM une fois quantifié, produit de l'audio en 90 millisecondes pour une entrée typique, et génère la parole à six fois la vitesse temps réel. Il tourne sur n'importe quel laptop ou smartphone, y compris sur du matériel vieillissant. Le modèle couvre neuf langues — anglais, français, allemand, espagnol, néerlandais, portugais, italien, hindi et arabe — et peut cloner une voix à partir de seulement cinq secondes d'audio de référence. L'enjeu est considérable : le marché mondial de la voix IA a dépassé 22 milliards de dollars en 2026, et le seul segment des agents vocaux est projeté à 47,5 milliards d'ici 2034. Jusqu'ici, ce marché est dominé par des acteurs propriétaires — ElevenLabs, Google Cloud avec Chirp 3, OpenAI — qui vendent l'accès à leurs modèles via API : les entreprises louent la voix, elles ne la possèdent pas. Mistral propose le modèle inverse : télécharger les poids, déployer en local, garder un contrôle total sur les données audio. Pour les secteurs soumis à des contraintes de confidentialité strictes — finance, santé, défense — c'est une proposition fondamentalement différente. Voxtral TTS s'inscrit dans une stratégie cohérente que Mistral construit pièce par pièce depuis plusieurs mois. La startup a lancé Voxtral Transcribe (speech-to-text) quelques semaines plus tôt, sa plateforme de personnalisation Forge lors de la conférence Nvidia GTC début mars, et son infrastructure de production AI Studio. L'objectif affiché est de permettre aux entreprises de faire tourner un pipeline audio complet — de la voix à la voix — sans dépendre d'aucun fournisseur externe. « Nous voyons l'audio comme un grand pari, et probablement la seule interface future avec tous les modèles d'IA », a déclaré Pierre Stock, vice-président science et premier employé de Mistral, dans une interview exclusive à VentureBeat. Dans un marché où ElevenLabs vient d'annoncer une collaboration avec IBM pour intégrer ses voix dans la plateforme watsonx Orchestrate, Mistral choisit de jouer la carte de la souveraineté plutôt que celle du service managé — un pari sur le fait que les grandes entreprises préféreront, à terme, la maîtrise à la commodité.

UEMistral AI, startup parisienne, offre aux entreprises françaises et européennes une solution TTS souveraine déployable en local, répondant directement aux contraintes de confidentialité des secteurs régulés (finance, santé, défense) sans dépendance aux fournisseurs API américains.

💬 La vraie info c'est pas les benchmarks face à ElevenLabs, c'est qu'on télécharge les poids et ça tourne en local, sans qu'une seule seconde d'audio quitte ta machine. C'était le verrou pour tout le secteur régulé, finance, santé, défense, qui ne peut pas se permettre d'envoyer ses données vocales à San Francisco. Je pensais que Mistral mettrait plus de temps, mais là ils posent les briques vite.

LLMsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic