Aller au contenu principal
30 voix, des émotions, des soupirs… Google Vids vient de rendre l’IA plus humaine que jamais
OutilsLe Big Data6sem

30 voix, des émotions, des soupirs… Google Vids vient de rendre l’IA plus humaine que jamais

Résumé IASource uniqueImpact UE
Source originale ↗·

Google a déployé le 15 avril 2026 une mise à jour majeure de Google Vids, son outil de création vidéo intégré à Workspace, en introduisant une trentaine de nouvelles voix IA expressives. Ces voix sont propulsées par Gemini 3.1 Flash TTS, un moteur de synthèse vocale de nouvelle génération capable d'intégrer des émotions, des pauses et des effets sonores directement dans la narration. Concrètement, les utilisateurs peuvent désormais insérer des instructions dans leur script, un mot lu avec enthousiasme, une pause marquée via une notation simple, voire un rire naturel, pour guider la performance vocale sans retouche audio manuelle. La mise à jour étend également la couverture linguistique de 8 à 24 langues, ajoutant notamment l'arabe, le bengali, l'hindi, le polonais, le thaï et le vietnamien. Le déploiement est progressif pour les comptes Google Workspace, Workspace Individual et les comptes personnels.

Cette évolution répond à une limite longtemps reprochée aux outils de narration automatique : le ton uniforme et mécanique qui trahit immédiatement l'origine synthétique du contenu. Avec un panel de trente voix aux registres distincts, certaines dynamiques, d'autres pédagogiques ou posées, Google Vids permet d'adapter le style vocal au type de contenu sans effort supplémentaire. Une vidéo de formation peut désormais sonner différemment d'une présentation commerciale, ce qui réduit la fatigue auditive et renforce la crédibilité des productions. Pour les équipes qui utilisent Google Vids à grande échelle pour créer des tutoriels, des onboardings ou des communications internes, l'impact pratique est immédiat : moins de post-production, une meilleure rétention de l'audience, et une flexibilité narrative que les voix TTS classiques ne permettaient tout simplement pas.

Google Vids, lancé en 2024 comme outil de création vidéo assistée par IA au sein de la suite Workspace, cherche à se positionner face à des concurrents comme HeyGen, Synthesia ou ElevenLabs qui ont fait de l'expressivité vocale leur argument central. L'intégration de Gemini 3.1 Flash TTS marque un tournant : Google dispose désormais d'un modèle capable de rivaliser sur ce terrain, en s'appuyant sur son écosystème d'entreprise déjà massivement déployé. L'ouverture à 24 langues signale aussi une ambition internationale claire, notamment vers les marchés asiatiques et du Moyen-Orient où la demande en contenu vidéo professionnel localisé est forte. La prochaine étape logique serait le clonage vocal personnalisé ou la synchronisation labiale, des fonctionnalités que plusieurs concurrents proposent déjà et que Google n'a pas encore annoncées pour Vids.

Impact France/UE

Les équipes françaises utilisant Google Workspace bénéficient immédiatement de voix expressives en français et d'une réduction du temps de post-production pour leurs contenus vidéo internes.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Verge AI 

Google Gemini peut désormais répondre à vos questions avec des modèles 3D et des simulations

Google a dévoilé une nouvelle fonctionnalité pour son assistant Gemini permettant de générer des modèles 3D interactifs et des simulations en réponse aux questions des utilisateurs. Concrètement, lorsqu'un utilisateur pose une question sur un phénomène physique ou scientifique, Gemini peut désormais produire une représentation tridimensionnelle animée, accompagnée de commandes permettant de la manipuler en temps réel : rotation du modèle, curseurs pour ajuster des paramètres, boutons pour mettre en pause ou masquer certains éléments visuels. Lors d'un test rapporté par The Verge, un utilisateur a demandé une simulation de la Lune orbitant autour de la Terre, et Gemini a généré un modèle 3D complet avec un curseur pour contrôler la vitesse de l'orbite, une option pour masquer la trajectoire et un bouton de pause. Cette évolution représente un changement notable dans la façon dont les IA conversationnelles transmettent l'information. Plutôt que de se limiter à du texte ou des images statiques, Gemini ouvre la voie à une pédagogie interactive, particulièrement utile pour l'enseignement des sciences, de la physique ou de l'astronomie. Les enseignants, étudiants et professionnels pourront explorer des concepts complexes de manière intuitive, sans recourir à des logiciels spécialisés. Cette fonctionnalité s'inscrit dans la course que se livrent les grands acteurs de l'IA générative pour différencier leurs produits au-delà du simple chat textuel. Google, qui fait face à une concurrence intense d'OpenAI et d'Anthropic, cherche à positionner Gemini comme un assistant multimodal de référence. La capacité à produire des visualisations dynamiques et paramétrables pourrait devenir un avantage décisif, notamment dans les secteurs éducatif et scientifique.

UELes utilisateurs européens de Gemini peuvent dès maintenant exploiter cette fonctionnalité pour l'enseignement scientifique et la vulgarisation, sans nécessiter de logiciels spécialisés.

OutilsOutil
1 source
Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous
2Le Big Data 

Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous

Lors de la conférence Google I/O 2026, Google a dévoilé une nouvelle génération d'agents IA capables de parcourir le web de façon autonome et proactive, à la place des utilisateurs. Ces agents s'ajoutent à plusieurs annonces majeures de l'événement, dont les modèles Gemini Omni, Gemini Spark et Gemini 3.5 Flash. Concrètement, un utilisateur peut confier à ces agents une tâche récurrente, trouver un studio avec balcon près d'une gare sous un budget donné, repérer un concert, comparer des prix de voyage, et l'IA surveille en continu les sources pertinentes, SeLoger, Leboncoin ou autres, pour alerter dès qu'une offre correspond aux critères définis. L'interface est conversationnelle : les demandes s'affinent en langage naturel, sans avoir à reformuler des requêtes rigides. Ces agents seront d'abord réservés aux abonnés Google AI Pro et AI Ultra aux États-Unis, avant un déploiement plus large. Ce changement marque un basculement de la recherche passive vers la recherche proactive. Pendant des décennies, utiliser Google signifiait taper des mots-clés, parcourir des liens et recommencer la manœuvre régulièrement. Ici, c'est l'agent qui prend l'initiative, surveille, compare et synthétise, libérant l'utilisateur de la corvée de répétition. Pour les particuliers en quête d'un logement, d'un billet d'avion ou d'un bon plan commercial, le gain de temps est potentiellement considérable. Pour les sites d'annonces et comparateurs, la menace est symétrique : si Google devient le premier agrégateur de leurs données, leur trafic direct pourrait s'effondrer, restructurant en profondeur l'économie de l'information en ligne. Google prévoit de connecter ces agents à Gmail, Google Photos et bientôt Google Agenda, afin de personnaliser les réponses en fonction de la vie réelle de chaque utilisateur. La firme de Mountain View insiste sur le contrôle laissé aux utilisateurs, mais cette intégration dessine un écosystème où Google deviendrait l'intermédiaire central entre les internautes et le reste du web, connaissant habitudes, déplacements, projets et préférences avec une précision inédite. Ce mouvement s'inscrit dans une course accélérée entre les géants technologiques : Microsoft avec Copilot, OpenAI avec ses propres agents et Anthropic positionnent tous leurs modèles sur ce terrain de l'autonomie IA. Google, fort de ses données propriétaires et de sa maîtrise de l'infrastructure de recherche, joue ici une carte que ses concurrents ne peuvent pas facilement dupliquer, mais les questions sur la vie privée et la concentration du pouvoir numérique resteront au cœur du débat à mesure que ces outils se généraliseront.

UELes plateformes françaises d'annonces comme SeLoger et Leboncoin s'exposent à une chute de trafic si Google s'impose comme agrégateur central, et l'intégration de données personnelles dans Gmail et Photos soulève des questions de conformité RGPD pour les utilisateurs européens.

OutilsOutil
1 source
Google Meet va aussi prendre des notes IA pour les réunions en présentiel
3The Verge 

Google Meet va aussi prendre des notes IA pour les réunions en présentiel

Google étend les capacités de son assistant IA Gemini aux réunions en présentiel : la fonction de prise de notes automatique, jusqu'ici réservée aux appels Google Meet, peut désormais générer des résumés et des transcriptions lors de réunions physiques, mais aussi lors de visioconférences Zoom et Microsoft Teams. Cette évolution, révélée par 9to5Google, marque une sortie de la phase alpha où la fonctionnalité était uniquement disponible sur Android pour un groupe restreint d'utilisateurs. Elle est désormais accessible plus largement, sans contrainte de salle de réunion ni de rendez-vous planifié à l'avance. L'impact est significatif pour les professionnels qui alternent entre réunions virtuelles et physiques : Gemini devient un assistant de réunion universel, indépendant du support utilisé. La possibilité de capturer automatiquement les échanges lors d'une discussion informelle dans un couloir ou d'une réunion de dernière minute représente un gain de temps concret. Google précise également qu'un participant distant peut rejoindre une réunion en présentiel en basculant vers un appel vidéo classique. Cette annonce s'inscrit dans une course entre les grands acteurs technologiques pour intégrer l'IA dans les flux de travail quotidiens. Microsoft propose des fonctions similaires via Copilot dans Teams, et plusieurs startups comme Otter.ai ou Fireflies.ai ont bâti leur modèle entier sur la transcription de réunions. En élargissant Gemini au-delà de son propre écosystème, Google adopte une stratégie d'ubiquité visant à fidéliser les utilisateurs professionnels quel que soit leur environnement de collaboration.

UELes professionnels européens utilisant Google Workspace peuvent désormais bénéficier de la prise de notes automatique Gemini dans leurs réunions physiques et sur Zoom ou Teams, sans dépendre d'un outil tiers.

OutilsOutil
1 source
Agents IA, recherche 24/7… la plus grosse refonte de Google Search depuis 25 ans
4Le Big Data 

Agents IA, recherche 24/7… la plus grosse refonte de Google Search depuis 25 ans

Lors de la conférence Google I/O 2026, le 19 mai, Google a officiellement enterré les « dix liens bleus » qui avaient défini la recherche sur internet depuis un quart de siècle. La refonte s'articule autour de trois axes majeurs déployés simultanément à l'échelle mondiale. D'abord, une nouvelle Intelligent Search Box remplace l'ancienne barre de saisie : l'interface s'adapte dynamiquement aux questions longues formulées en langage naturel et accepte désormais le glisser-déposer d'images, de fichiers PDF, de vidéos ou d'onglets Chrome directement dans le champ de recherche. Un système baptisé Query Coaching analyse l'intention de l'utilisateur en temps réel et suggère des reformulations avant même que la requête ne soit envoyée. Sous le capot, Google a intégré Gemini 3.5 Flash, son nouveau modèle phare, comme moteur par défaut de l'AI Mode désormais disponible partout : les réponses synthétiques s'affichent quatre fois plus vite que dans les versions précédentes, permettant une conversation continue avec suivi de contexte depuis les résultats. Enfin, les Information Agents, agents autonomes capables de surveiller le web en continu 24h/24, permettent à un utilisateur de déléguer la veille d'un sujet à une IA qui travaille en arrière-plan et notifie proactivement. L'impact est structurel pour l'ensemble de l'écosystème numérique. Pour les utilisateurs, la recherche cesse d'être un exercice de traduction de pensées en mots-clés calibrés : on peut interroger Google comme on pose une question à un expert, avec des documents en main. Pour les médias et éditeurs web, la bascule vers des réponses synthétiques générées par l'IA intensifie une menace déjà réelle sur le trafic organique, puisque le moteur répond de plus en plus sans renvoyer vers une source. Pour les entreprises, la surveillance automatisée par agents change radicalement la veille concurrentielle et la gestion de l'e-réputation, jusqu'ici réservées aux outils spécialisés. Cette transformation s'inscrit dans une course engagée depuis l'irruption de ChatGPT fin 2022, qui a forcé Google à accélérer son agenda IA et à assumer un risque de cannibalisation de son propre modèle publicitaire. Microsoft avait intégré GPT-4 dans Bing dès 2023, sans renverser les parts de marché, mais l'urgence stratégique n'en était pas moins réelle pour Google. La société a répondu avec les AI Overviews, déployées à grande échelle en 2024 malgré une série de bugs embarrassants, puis avec l'AI Mode progressivement étendu. Google I/O 2026 marque le saut qualitatif suivant : le moteur ne répond plus seulement aux requêtes, il anticipe les besoins et agit en autonomie. La question qui demeure ouverte est celle du financement du modèle : comment Google monétisera-t-il une interface où l'utilisateur n'a plus besoin de cliquer sur quoi que ce soit.

UELa bascule vers des réponses synthétiques générées par l'IA menace le trafic organique des éditeurs et médias français et européens, tandis que les agents autonomes de veille soulèvent des questions de conformité avec l'AI Act européen.

💬 Les agents de veille 24/7, c'est ce qu'on attendait depuis un moment. Jusqu'ici tu sortais la carte bleue pour Mention ou un outil dédié, là c'est embarqué nativement et accessible à tout le monde. Sur la monétisation, par contre, bonne question, parce que vendre de la pub sur une interface où personne ne clique, ça va être coton.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour