
Cohere lance Cohere Transcribe, un modèle de reconnaissance vocale automatique de pointe pour les entreprises
Cohere fait une entrée remarquée sur le marché de la reconnaissance vocale automatique avec le lancement de Cohere Transcribe, un modèle ASR (Automatic Speech Recognition) taillé pour les besoins des entreprises. Dès son lancement le 26 mars 2026, le modèle s'est hissé à la première place du classement Hugging Face Open ASR Leaderboard, avec un taux d'erreur moyen (WER) de 5,42 % — une performance qui devance des références établies comme Whisper Large v3 de OpenAI (7,44 %) ou ElevenLabs Scribe v2 (5,83 %).
Ce lancement marque un tournant stratégique pour Cohere, jusqu'ici uniquement positionné sur les modèles de génération de texte et d'embeddings. En s'attaquant à la transcription audio, l'entreprise cible un segment critique pour les entreprises : les réunions, auditions juridiques, appels d'analystes et contenus multimédia non structurés qui représentent une masse considérable de données inexploitées. La promesse est claire — remplacer des pipelines complexes d'API propriétaires par un modèle de production fiable et précis.
Sur le plan technique, Cohere Transcribe repose sur une architecture hybride Conformer-Transformer : un large encodeur Conformer (combinant réseaux convolutifs et Transformers pour capturer à la fois les détails acoustiques fins et le contexte linguistique global) couplé à un décodeur Transformer allégé. Le modèle prend officiellement en charge 14 langues dont l'anglais, le français, l'allemand, l'arabe, le chinois ou le japonais. Pour les fichiers audio longs, un mécanisme de découpage en segments de 35 secondes avec chevauchement garantit la continuité des transcriptions sans saturer la mémoire GPU. Les préférences humaines confirment la supériorité du modèle : les annotateurs l'ont préféré dans 78 % des comparaisons face à IBM Granite 4.0 1B Speech, 67 % contre NVIDIA Canary Qwen 2.5B, et 64 % contre Whisper Large v3.
Avec ce positionnement "qualité sur quantité" — 14 langues maîtrisées plutôt qu'une centaine approximatives —, Cohere signale une ambition claire : s'imposer comme l'alternative entreprise sérieuse aux solutions de Google, OpenAI et ElevenLabs sur un marché de la transcription professionnelle en pleine consolidation.
Cohere Transcribe supporte le français parmi ses 14 langues et se positionne comme alternative souveraine aux APIs américaines pour les entreprises européennes souhaitant traiter des données audio sensibles en interne.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.


