OutilsLe Big Data · 20 avr. 2026, 22:15· 2 min de lecture

30 voix, des émotions, des soupirs… Google Vids vient de rendre l’IA plus humaine que jamais

Google a déployé le 15 avril 2026 une mise à jour majeure de Google Vids, son outil de création vidéo intégré à Workspace, en introduisant une trentaine de nouvelles voix IA expressives. Ces voix sont propulsées par Gemini 3.1 Flash TTS, un moteur de synthèse vocale de nouvelle génération capable d'intégrer des émotions, des pauses et des effets sonores directement dans la narration. Concrètement, les utilisateurs peuvent désormais insérer des instructions dans leur script, un mot lu avec enthousiasme, une pause marquée via une notation simple, voire un rire naturel, pour guider la performance vocale sans retouche audio manuelle. La mise à jour étend également la couverture linguistique de 8 à 24 langues, ajoutant notamment l'arabe, le bengali, l'hindi, le polonais, le thaï et le vietnamien. Le déploiement est progressif pour les comptes Google Workspace, Workspace Individual et les comptes personnels.

Cette évolution répond à une limite longtemps reprochée aux outils de narration automatique : le ton uniforme et mécanique qui trahit immédiatement l'origine synthétique du contenu. Avec un panel de trente voix aux registres distincts, certaines dynamiques, d'autres pédagogiques ou posées, Google Vids permet d'adapter le style vocal au type de contenu sans effort supplémentaire. Une vidéo de formation peut désormais sonner différemment d'une présentation commerciale, ce qui réduit la fatigue auditive et renforce la crédibilité des productions. Pour les équipes qui utilisent Google Vids à grande échelle pour créer des tutoriels, des onboardings ou des communications internes, l'impact pratique est immédiat : moins de post-production, une meilleure rétention de l'audience, et une flexibilité narrative que les voix TTS classiques ne permettaient tout simplement pas.

Google Vids, lancé en 2024 comme outil de création vidéo assistée par IA au sein de la suite Workspace, cherche à se positionner face à des concurrents comme HeyGen, Synthesia ou ElevenLabs qui ont fait de l'expressivité vocale leur argument central. L'intégration de Gemini 3.1 Flash TTS marque un tournant : Google dispose désormais d'un modèle capable de rivaliser sur ce terrain, en s'appuyant sur son écosystème d'entreprise déjà massivement déployé. L'ouverture à 24 langues signale aussi une ambition internationale claire, notamment vers les marchés asiatiques et du Moyen-Orient où la demande en contenu vidéo professionnel localisé est forte. La prochaine étape logique serait le clonage vocal personnalisé ou la synchronisation labiale, des fonctionnalités que plusieurs concurrents proposent déjà et que Google n'a pas encore annoncées pour Vids.

Impact France/UE

Les équipes françaises utilisant Google Workspace bénéficient immédiatement de voix expressives en français et d'une réduction du temps de post-production pour leurs contenus vidéo internes.

Dans nos dossiers

Gemini

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Google vient (encore) de rendre NotebookLM plus intelligent

Google a déployé le 8 juin 2026 une mise à jour majeure de NotebookLM, son outil d'assistance à la recherche, en l'alimentant avec le modèle Gemini 3.5. La nouveauté la plus structurante est l'intégration directe de la recherche Google dans le flux de travail : l'utilisateur peut désormais démarrer un projet sans importer aucun document au préalable. Une simple question suffit pour que l'outil parte lui-même chercher des sources sur le Web, les évalue et en propose une sélection. L'utilisateur conserve la main sur les sources effectivement intégrées, mais le service ne se contente plus de traiter de la matière fournie, il participe activement à sa collecte. Par ailleurs, NotebookLM intègre désormais un environnement cloud sécurisé basé sur la plateforme Antigravity de Google, qui lui permet d'exécuter du code, de manipuler des jeux de données, de produire des analyses et de générer des graphiques. Les exports couvrent maintenant PDF, feuilles Excel, présentations PowerPoint, tableaux CSV et visualisations d'images. Cette mise à jour est réservée, au lancement, aux abonnés Google AI Ultra. Ces évolutions changent concrètement la nature de l'outil. NotebookLM glisse du statut de résumeur de documents vers celui d'assistant de recherche agentique, capable de couvrir l'intégralité du flux de travail : collecte, analyse, synthèse, présentation. Pour les chercheurs, étudiants et professionnels qui traitent de gros volumes d'information, la combinaison recherche autonome et exécution de code représente un gain de temps substantiel. La possibilité d'exporter directement vers les formats bureautiques standards réduit les frictions entre la phase exploratoire et la phase de restitution, deux moments qui exigent aujourd'hui souvent des outils distincts. La limite reste la nécessité de vérifier les sorties de l'IA, en particulier les analyses de données, même lorsque le système paraît sûr de lui. NotebookLM avait été lancé en version expérimentale en 2023 avant d'être rendu public en 2024, en s'appuyant sur le principe du RAG, réponses ancrées dans des documents fournis par l'utilisateur plutôt que dans les données d'entraînement seules. Cette contrainte le distinguait des assistants généralistes, mais le limitait aussi à ce que l'utilisateur apportait. Le virage agentique annoncé ici place Google en concurrence directe avec des outils comme Perplexity ou les modes de recherche avancés de ChatGPT, qui misent eux aussi sur la capacité à aller chercher l'information de façon autonome. Google dispose d'un avantage structurel évident : son moteur de recherche. L'intégration native de cette infrastructure dans NotebookLM pourrait lui conférer une pertinence documentaire difficile à égaler pour ses concurrents, à condition que l'expérience utilisateur suive et que le produit sorte de sa niche d'abonnés premium.

UEDisponible aux abonnés européens d'AI Ultra, cette mise à jour n'a pas d'impact institutionnel ou réglementaire spécifique pour la France ou l'UE.

💬 C'est exactement le virage qu'on attendait depuis que Perplexity a prouvé qu'aller chercher les sources soi-même, ça change tout. Google avait cet avantage depuis le début, son propre moteur, il l'intègre enfin là où ça compte. Bon, pour l'instant c'est AI Ultra only, donc faut pas s'attendre à ce que ça déferle tout de suite.

OutilsOutil

1 source

2The Verge AI

Google Gemini peut désormais répondre à vos questions avec des modèles 3D et des simulations

Google a dévoilé une nouvelle fonctionnalité pour son assistant Gemini permettant de générer des modèles 3D interactifs et des simulations en réponse aux questions des utilisateurs. Concrètement, lorsqu'un utilisateur pose une question sur un phénomène physique ou scientifique, Gemini peut désormais produire une représentation tridimensionnelle animée, accompagnée de commandes permettant de la manipuler en temps réel : rotation du modèle, curseurs pour ajuster des paramètres, boutons pour mettre en pause ou masquer certains éléments visuels. Lors d'un test rapporté par The Verge, un utilisateur a demandé une simulation de la Lune orbitant autour de la Terre, et Gemini a généré un modèle 3D complet avec un curseur pour contrôler la vitesse de l'orbite, une option pour masquer la trajectoire et un bouton de pause. Cette évolution représente un changement notable dans la façon dont les IA conversationnelles transmettent l'information. Plutôt que de se limiter à du texte ou des images statiques, Gemini ouvre la voie à une pédagogie interactive, particulièrement utile pour l'enseignement des sciences, de la physique ou de l'astronomie. Les enseignants, étudiants et professionnels pourront explorer des concepts complexes de manière intuitive, sans recourir à des logiciels spécialisés. Cette fonctionnalité s'inscrit dans la course que se livrent les grands acteurs de l'IA générative pour différencier leurs produits au-delà du simple chat textuel. Google, qui fait face à une concurrence intense d'OpenAI et d'Anthropic, cherche à positionner Gemini comme un assistant multimodal de référence. La capacité à produire des visualisations dynamiques et paramétrables pourrait devenir un avantage décisif, notamment dans les secteurs éducatif et scientifique.

UELes utilisateurs européens de Gemini peuvent dès maintenant exploiter cette fonctionnalité pour l'enseignement scientifique et la vulgarisation, sans nécessiter de logiciels spécialisés.

OutilsOutil

1 source

3Le Big Data

Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous

Lors de la conférence Google I/O 2026, Google a dévoilé une nouvelle génération d'agents IA capables de parcourir le web de façon autonome et proactive, à la place des utilisateurs. Ces agents s'ajoutent à plusieurs annonces majeures de l'événement, dont les modèles Gemini Omni, Gemini Spark et Gemini 3.5 Flash. Concrètement, un utilisateur peut confier à ces agents une tâche récurrente, trouver un studio avec balcon près d'une gare sous un budget donné, repérer un concert, comparer des prix de voyage, et l'IA surveille en continu les sources pertinentes, SeLoger, Leboncoin ou autres, pour alerter dès qu'une offre correspond aux critères définis. L'interface est conversationnelle : les demandes s'affinent en langage naturel, sans avoir à reformuler des requêtes rigides. Ces agents seront d'abord réservés aux abonnés Google AI Pro et AI Ultra aux États-Unis, avant un déploiement plus large. Ce changement marque un basculement de la recherche passive vers la recherche proactive. Pendant des décennies, utiliser Google signifiait taper des mots-clés, parcourir des liens et recommencer la manœuvre régulièrement. Ici, c'est l'agent qui prend l'initiative, surveille, compare et synthétise, libérant l'utilisateur de la corvée de répétition. Pour les particuliers en quête d'un logement, d'un billet d'avion ou d'un bon plan commercial, le gain de temps est potentiellement considérable. Pour les sites d'annonces et comparateurs, la menace est symétrique : si Google devient le premier agrégateur de leurs données, leur trafic direct pourrait s'effondrer, restructurant en profondeur l'économie de l'information en ligne. Google prévoit de connecter ces agents à Gmail, Google Photos et bientôt Google Agenda, afin de personnaliser les réponses en fonction de la vie réelle de chaque utilisateur. La firme de Mountain View insiste sur le contrôle laissé aux utilisateurs, mais cette intégration dessine un écosystème où Google deviendrait l'intermédiaire central entre les internautes et le reste du web, connaissant habitudes, déplacements, projets et préférences avec une précision inédite. Ce mouvement s'inscrit dans une course accélérée entre les géants technologiques : Microsoft avec Copilot, OpenAI avec ses propres agents et Anthropic positionnent tous leurs modèles sur ce terrain de l'autonomie IA. Google, fort de ses données propriétaires et de sa maîtrise de l'infrastructure de recherche, joue ici une carte que ses concurrents ne peuvent pas facilement dupliquer, mais les questions sur la vie privée et la concentration du pouvoir numérique resteront au cœur du débat à mesure que ces outils se généraliseront.

UELes plateformes françaises d'annonces comme SeLoger et Leboncoin s'exposent à une chute de trafic si Google s'impose comme agrégateur central, et l'intégration de données personnelles dans Gmail et Photos soulève des questions de conformité RGPD pour les utilisateurs européens.

OutilsOutil

1 source

4Le Big Data

Google Meet laisse maintenant Gemini prendre des notes à votre place pendant vos appels

Google intègre désormais Gemini dans Google Meet pour automatiser la prise de notes lors des visioconférences. La fonctionnalité, en cours de déploiement progressif, permet à l'assistant d'écouter les échanges en temps réel, d'identifier les points clés, les décisions prises et les prochaines étapes évoquées pendant l'appel. Un compte rendu structuré est ensuite généré automatiquement dans un document Google Docs enregistré sur le Drive de l'utilisateur, accompagné d'un e-mail récapitulatif envoyé à la fin de la réunion. Pour l'activer, il suffit de cliquer sur l'icône en forme de crayon dans l'interface Meet, ou de configurer l'option directement depuis les paramètres. La transparence est imposée par défaut : dès que Gemini prend la main, tous les participants reçoivent une notification visible. La fonctionnalité est réservée aux abonnés Google AI Pro, Google AI Ultra et à certains clients Google Workspace éligibles, avec une disponibilité linguistique encore limitée mais appelée à s'élargir. L'enjeu pratique est immédiat pour les professionnels dont les journées s'enchaînent en réunions : ne plus avoir à arbitrer entre suivre la conversation et capturer l'information en direct. En déléguant cette tâche à l'IA, Google cherche à réduire la charge cognitive des participants et à améliorer la qualité d'attention pendant les appels. La génération automatique des actions à mener représente également un gain de temps en aval, en évitant de relire des transcriptions brutes pour en extraire les engagements pris. Pour les équipes distribuées ou les organisations fortement dépendantes des outils Google Workspace, l'intégration native dans l'écosystème Drive et Gmail renforce l'attractivité du dispositif sans friction d'adoption supplémentaire. Cette annonce s'inscrit dans une stratégie d'intégration accélérée de Gemini à travers l'ensemble des produits Google, observable depuis le début de l'année 2025. Google concurrence frontalement Microsoft, qui déploie Copilot dans Teams avec des fonctionnalités comparables, et Zoom, qui a lancé ses propres outils de synthèse IA. La course à l'assistant de réunion intelligent est devenue un terrain central pour fidéliser les entreprises dans leurs écosystèmes cloud respectifs. La question de la confidentialité reste néanmoins structurante : l'obligation de notifier tous les participants signale que Google anticipe les résistances liées à l'enregistrement et à l'analyse automatique de conversations professionnelles. Le déploiement par paliers, d'abord réservé aux abonnés premium, laisse entendre que la fonctionnalité pourrait être étendue à terme à une base d'utilisateurs plus large, selon l'adoption et les retours terrain.

UEL'intégration de Gemini dans Google Meet soulève des questions de conformité RGPD pour les entreprises européennes utilisant Google Workspace, notamment concernant l'enregistrement et l'analyse automatique de conversations professionnelles.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic