Gemini 3.5 Translate va faire tomber la barrière des langues
Google a dévoilé le 9 juin 2026 Gemini 3.5 Translate, aussi appelé Gemini 3.5 Live Translate, un modèle audio capable de traduire des conversations orales en temps réel dans plus de 70 langues et plus de 2 000 combinaisons linguistiques. Contrairement aux systèmes précédents qui attendaient la fin d'une phrase complète avant de produire une traduction, ce nouveau modèle écoute, traite et restitue le flux audio en continu, avec un décalage de quelques secondes seulement. L'outil est déployé dans Google Traduction sur Android et iOS, dans Google Meet, et accessible aux développeurs via l'API Gemini Live. Google affirme également que le modèle conserve l'intonation, le rythme et la hauteur de voix du locuteur original, ce qui doit rendre la traduction moins mécanique. La technologie intègre aussi SynthID, un filigrane numérique embarqué dans le signal audio pour identifier les contenus générés par IA. La détection automatique des langues évite à l'utilisateur de changer manuellement les réglages lorsqu'un interlocuteur passe d'une langue à une autre.
L'enjeu dépasse largement la conversation touristique. Pour les entreprises opérant à l'international, Gemini 3.5 Translate ouvre la possibilité de réunions multilingues sans interprète externe, sans sous-titres approximatifs et sans anglais comme langue pivot imposée. Google Meet bénéficiait déjà d'une traduction partielle, mais le système restait très dépendant de l'anglais comme langue intermédiaire ; le passage à plus de 2 000 paires directes représente un changement d'architecture significatif. Pour les développeurs, l'accès via l'API Gemini Live signifie que cette capacité peut s'intégrer dans des applications de mobilité, des services clients automatisés ou des plateformes de communication, ce qui élargit considérablement l'usage potentiel au-delà des produits Google eux-mêmes.
La traduction en temps réel est un problème que l'industrie technologique tente de résoudre depuis des décennies, mais les systèmes actuels peinent encore dans les conditions réelles : bruits ambiants, accents marqués, expressions idiomatiques, locuteurs multiples. Google assure avoir entraîné Gemini 3.5 Translate spécifiquement sur ces scénarios difficiles, mais les démonstrations en conditions contrôlées restent insuffisantes pour valider la promesse. L'intégration de SynthID révèle par ailleurs une tension inhérente à la technologie : un modèle capable de reproduire fidèlement le ton et le rythme d'une voix humaine soulève des questions légitimes sur les usages détournés, notamment la falsification de propos. Microsoft avec Teams, Amazon avec Chime et des acteurs spécialisés comme Interprefy sont déjà positionnés sur ce marché. L'annonce de Google confirme que la traduction vocale en temps réel va devenir une fonctionnalité standard dans les outils de communication professionnels dans les prochains mois.
Les entreprises européennes opérant dans un contexte multilingue (l'UE compte 24 langues officielles) pourraient réduire leur dépendance aux interprètes professionnels via Google Meet et l'API, tandis que l'intégration de SynthID s'inscrit dans les exigences de traçabilité du contenu IA prévues par l'AI Act.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




