Aller au contenu principal
Avec cette nouveauté, Nano Banana 2 comprend vos goûts mieux que vous-même
CréationLe Big Data4sem

Avec cette nouveauté, Nano Banana 2 comprend vos goûts mieux que vous-même

Résumé IASource uniqueImpact UE
Source originale ↗·

Google a annoncé le 16 avril 2026 le lancement de Personal Intelligence, une nouvelle fonctionnalité intégrée à Gemini, son générateur d'images propulsé par intelligence artificielle. Concrètement, cette mise à jour permet à Gemini de comprendre les préférences et les centres d'intérêt d'un utilisateur sans que celui-ci ait besoin de les détailler dans chaque prompt. L'outil se connecte aux services Google existants pour capter les habitudes, les goûts et le style propre à chaque compte. L'intégration clé repose sur Google Photos : les images personnelles de l'utilisateur, ses proches, ses animaux ou ses souvenirs, servent désormais de référence directe pour enrichir les créations générées. Quelques mots suffisent là où il fallait auparavant rédiger des descriptions minutieuses et multiplier les essais.

L'impact est immédiat pour les utilisateurs réguliers de Gemini, qui perdaient jusqu'ici un temps considérable à expliquer leurs intentions créatives à l'outil. En déléguant une partie de ce travail à la machine, Google réduit la friction entre l'idée et le résultat. L'utilisateur peut se mettre en scène dans des styles variés, du dessin au fusain à la peinture numérique, avec un rendu ancré dans sa propre réalité visuelle plutôt que dans des généralités. Le contrôle reste entre ses mains : si une image ne convient pas, il peut corriger une instruction, changer de référence, et affiner le rendu sans repartir de zéro. L'outil affiche également les sources utilisées pour chaque génération, ce qui apporte une forme de transparence sur le processus.

Cette évolution s'inscrit dans une tendance lourde de l'IA générative : personnaliser toujours davantage l'expérience en exploitant les données numériques de l'utilisateur. Google précise que les photos personnelles ne servent pas directement à entraîner ses modèles et que l'activation des connexions reste sous contrôle de l'utilisateur. Mais plus l'outil devient précis et contextuel, plus il repose sur une empreinte numérique intime, ce qui soulève des questions durables sur la vie privée et la dépendance aux écosystèmes propriétaires. La course à la personnalisation oppose désormais Google à des acteurs comme Adobe Firefly ou Midjourney, qui développent eux aussi des fonctionnalités d'adaptation au style personnel. Personal Intelligence représente cependant un avantage structurel pour Google, qui dispose déjà d'une masse de données utilisateur sans équivalent via Photos, Search ou Gmail.

Impact France/UE

L'exploitation de données personnelles intimes (photos, historique) par Gemini pour personnaliser les créations soulève des questions de conformité RGPD directement applicables aux utilisateurs français et européens.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.
1Le Big Data 

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.

OpenAI a déployé discrètement GPT-Image-2 le 21 avril 2026, sans conférence de presse ni annonce officielle de Sam Altman, directement sur les comptes ChatGPT web et mobile de ses utilisateurs dans le monde entier. Ce nouveau moteur de génération d'images représente un saut qualitatif majeur par rapport à son prédécesseur sur trois dimensions précises : le rendu de texte, la gestion de compositions complexes et le photoréalisme. Les premiers tests diffusés sur X montrent des affiches de films avec une typographie parfaitement lisible, des maquettes de Unes du New York Times où chaque colonne et chaque ligne de crédit est nette, et surtout une grille 10x10 contenant 100 objets distincts commençant par la lettre A, chacun correctement nommé et illustré sans aucune erreur de cohérence visuelle ou textuelle. Ces avancées changent concrètement ce que les professionnels peuvent faire avec l'IA générative. Jusqu'ici, intégrer du texte lisible dans une image produite par IA relevait de la loterie : les modèles produisaient systématiquement des caractères déformés, illisibles, mélangés à du pixel noise. Avec GPT-Image-2, cette limite disparaît, ce qui ouvre des usages immédiatement opérationnels pour les designers graphiques, les équipes marketing et les créateurs de contenu : prototypage d'interfaces, création d'affiches, génération de visuels publicitaires avec du texte intégré, le tout en quelques secondes et sans retouche. La gestion de la complexité spatiale, illustrée par la grille 10x10, signifie également que le modèle peut produire des compositions denses et structurées sans perte de cohérence, là où Midjourney et les outils de Google montrent encore des limites significatives dès que la scène se complique. Ce lancement silencieux un mardi s'inscrit dans une stratégie qui n'est pas anodine. Plusieurs observateurs notent que ce type de déploiement discret précède souvent, chez OpenAI, une annonce plus massive dans les jours suivants, des rumeurs évoquent une présentation liée à GPT-5.5 dès jeudi. GPT-Image-2 est par ailleurs le moteur qui alimente déjà l'API Images d'OpenAI depuis quelques semaines, utilisé notamment par des applications tierces comme ChatGPT Canvas et certains outils Canva. Son ouverture progressive au grand public via ChatGPT marque une étape de maturité : le modèle sort du contexte développeur pour entrer dans l'usage quotidien de masse. La concurrence, notamment Midjourney, qui n'a toujours pas de produit web grand public stable, et Adobe Firefly, va devoir répondre à un outil qui combine désormais photoréalisme, précision textuelle et gestion de la complexité dans un seul package accessible à tous.

UELes designers et équipes marketing français et européens peuvent immédiatement intégrer cet outil à leurs workflows pour générer des visuels avec texte lisible intégré, sans retouche manuelle.

💬 Le rendu de texte dans les images IA, c'était le dernier gros problème non résolu. GPT-Image-2 le ferme pour de bon : grille 10x10 sans une seule erreur, affiches avec typo lisible au premier coup d'oeil, c'est le genre de démo qui change ce qu'on peut promettre à un client dès demain matin. Midjourney n'a toujours pas de produit web stable, là ils vont vraiment souffrir.

CréationOpinion
1 source
OpenAI s'attaque à Google avec son nouveau modèle d'image
2The Information AI 

OpenAI s'attaque à Google avec son nouveau modèle d'image

OpenAI prépare discrètement un nouveau modèle de génération d'images, officieusement baptisé "gpt-image-2" par la communauté en ligne. Depuis plusieurs semaines, des images produites par ce modèle circulent sur X et Reddit, repérées par des utilisateurs attentifs qui ont identifié des tests en cours auprès d'une sélection de comptes ChatGPT et sur des plateformes de classement anonymes. Les résultats sont frappants : les images générées atteignent un niveau de photoréalisme tel qu'elles sont, dans certains cas, pratiquement impossibles à distinguer de photographies authentiques. L'enjeu dépasse largement la prouesse technique. OpenAI vise explicitement 1 milliard d'utilisateurs actifs hebdomadaires sur ChatGPT, un seuil symbolique que l'entreprise espérait franchir avant fin 2025. Elle a manqué cet objectif et stagne depuis dans une fourchette autour de 920 millions d'utilisateurs par semaine. Un modèle d'image nettement supérieur aux solutions existantes pourrait constituer le levier capable de débloquer cette croissance, en attirant une nouvelle vague d'utilisateurs grand public, créatifs et professionnels, qui restent encore sur des outils concurrents comme Midjourney ou les offres de Google. La bataille des modèles d'image s'intensifie à mesure que les grands acteurs de l'IA cherchent à consolider leur position. Google, avec Imagen, et les plateformes spécialisées font face à une OpenAI qui cherche à intégrer toujours davantage de capacités directement dans ChatGPT pour en faire un point d'entrée unique. Le lancement officiel de gpt-image-2 n'a pas encore été annoncé, mais la stratégie de tests progressifs suggère une sortie imminente. Si le modèle tient ses promesses de photoréalisme à grande échelle, il pourrait redistribuer significativement les parts de marché dans un secteur où la qualité visuelle est devenue le principal critère de différenciation.

CréationOpinion
1 source
Tencent HY-World 2.0 : cette IA transforme vos mots en jeux vidéo… et c’est open source !
3Le Big Data 

Tencent HY-World 2.0 : cette IA transforme vos mots en jeux vidéo… et c’est open source !

Tencent a publié le 16 avril 2026 HY-World 2.0, un modèle d'intelligence artificielle open source capable de générer des environnements 3D interactifs complets à partir d'un simple texte, d'une image ou d'une vidéo. Le processus prend environ 712 secondes, soit moins de douze minutes, en exploitant des GPU NVIDIA H20. Le modèle repose sur une chaîne de quatre modules spécialisés : HY-Pano 2.0 convertit le point de départ en panorama sphérique à 360 degrés, WorldNav planifie jusqu'à 35 trajectoires de caméra pour explorer l'espace sans collision, WorldStereo 2.0 génère de nouvelles vues pour combler les angles morts, et WorldMirror 2.0 reconstruit la scène finale en 3D Gaussian Splatting. L'algorithme MaskGaussian réduit le volume des données de 73,7 % en éliminant les points superflus, sans dégrader la qualité visuelle, maintenant un PSNR de 25.017. Les scènes exportées sont directement compatibles avec Unity et Unreal Engine, et incluent la détection de collisions pour la robotique. Tencent publie les poids, le code et le rapport technique en accès libre. Cette publication change concrètement l'accès à la génération de mondes 3D, jusqu'ici réservée à des équipes disposant de ressources considérables. Un développeur de jeu indépendant, un studio de simulation ou une équipe de robotique peut désormais produire un environnement 3D explorable en moins d'un quart d'heure, sans pipeline propriétaire ni licence coûteuse. Le fait que les exports soient nativement compatibles avec les deux moteurs de jeu dominants du marché supprime une étape d'intégration habituellement chronophage. Pour la robotique incarnée, la possibilité de générer des environnements de simulation physiquement cohérents à la demande ouvre des perspectives importantes pour l'entraînement d'agents autonomes à moindre coût. HY-World 2.0 arrive dans un contexte de compétition intense autour des "world models", ces systèmes capables de simuler des environnements physiquement plausibles. Google DeepMind a présenté Genie 3, qui adopte une approche par génération vidéo, tandis que World Labs de Fei-Fei Li a lancé Marble, solution entièrement fermée. Tencent choisit délibérément l'open source pour s'imposer comme référence de la recherche et attirer la communauté des développeurs, une stratégie déjà utilisée avec la série Hunyuan sur la génération d'images et de vidéos. L'enjeu dépasse le jeu vidéo : les world models sont considérés comme une brique fondamentale pour entraîner des robots et des agents IA capables d'agir dans le monde réel. En rendant HY-World 2.0 librement accessible, Tencent accélère la diffusion de cette technologie et complique la position des acteurs qui misaient sur la fermeture de leurs systèmes comme avantage concurrentiel.

UELes studios indépendants et équipes de robotique français et européens peuvent désormais générer des environnements 3D professionnels gratuitement, réduisant leur dépendance aux solutions propriétaires coûteuses.

💬 12 minutes pour un monde 3D explorable, exportable direct dans Unity ou Unreal, open source. Ce qui est intéressant ici, c'est pas la performance technique (solide, mais la concurrence existe), c'est que Tencent lâche tout en public pile au moment où World Labs joue la carte du fermé, le même coup qu'avec Hunyuan. Un studio indé peut démarrer avec ça demain, sans débourser un centime.

CréationOpinion
1 source
On est dans Black Mirror ? Google va cloner tous les YouTubers avec l’IA
4Le Big Data 

On est dans Black Mirror ? Google va cloner tous les YouTubers avec l’IA

Google vient de déployer sur YouTube une fonctionnalité permettant aux créateurs de contenu de générer un avatar numérique à partir d'un simple selfie et d'un enregistrement vocal. Le système produit une réplique photoréaliste capable d'apparaître dans des vidéos YouTube Shorts, à partir d'une consigne écrite. La génération produit des séquences de huit secondes. Pour l'instant, l'accès est réservé aux adultes titulaires d'un compte. Google recommande un éclairage soigné et un environnement silencieux pour obtenir un résultat convaincant. Chaque clip généré est marqué avec SynthID, le filigrane numérique de Google, et porte une étiquette visible signalant l'origine artificielle du contenu. La plateforme s'appuie également sur le standard de certification C2PA pour garantir la traçabilité. Les créateurs conservent le contrôle sur leur avatar : ils peuvent le supprimer à tout moment, et les données sont effacées automatiquement après trois ans d'inactivité. La suppression d'une vidéo générée ne supprime toutefois pas le fichier source original stocké dans le compte. Cette innovation ouvre une brèche concrète dans les habitudes de production vidéo. Un créateur peut désormais publier du contenu sans tourner une seule prise de vue réelle, ce qui réduit les contraintes matérielles et de temps liées au tournage. Pour les YouTubers prolifiques ou ceux qui peinent à maintenir un rythme régulier de publication, l'outil représente un gain opérationnel significatif. Mais la technologie soulève aussi des questions de fond : si n'importe quel visage peut être reproduit avec un simple enregistrement, les risques de détournement ou d'usurpation d'identité numérique deviennent concrets. Les mécanismes de protection mis en place par Google, aussi sérieux soient-ils, reposent sur une infrastructure technique que les utilisateurs ne contrôlent pas entièrement. La saturation du flux de contenu constitue un autre effet collatéral probable : si la production d'une vidéo ne demande plus qu'une ligne de texte, le volume de contenus disponibles pourrait augmenter de façon spectaculaire, rendant la découvrabilité encore plus difficile pour les créateurs indépendants. Cette annonce s'inscrit dans une stratégie d'intégration accélérée de l'IA générative au sein de l'écosystème YouTube. Google avait déjà introduit des carrousels générés par IA dans les résultats de recherche, des outils de mise à l'échelle automatique pour améliorer les vidéos basse résolution, et des fonctions d'édition automatisée. La concurrence s'intensifie avec des plateformes comme TikTok ou Meta qui investissent également dans les avatars synthétiques et les outils de création assistée. La question des droits à l'image dans un environnement où le clonage devient accessible au grand public reste largement ouverte sur le plan juridique, notamment en Europe où le RGPD impose des contraintes strictes sur le traitement des données biométriques. YouTube se retrouve ainsi à l'avant-garde d'un débat qui dépasse le simple outil créatif.

UELe déploiement de cette fonctionnalité de clonage biométrique soulève des questions juridiques directes en Europe, où le RGPD impose des contraintes strictes sur le traitement des données biométriques, ce qui pourrait limiter ou retarder sa disponibilité pour les créateurs européens.

CréationOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour