CréationLe Big Data · 17 avr. 2026, 10:02· 2 min de lecture

Avec cette nouveauté, Nano Banana 2 comprend vos goûts mieux que vous-même

Google a annoncé le 16 avril 2026 le lancement de Personal Intelligence, une nouvelle fonctionnalité intégrée à Gemini, son générateur d'images propulsé par intelligence artificielle. Concrètement, cette mise à jour permet à Gemini de comprendre les préférences et les centres d'intérêt d'un utilisateur sans que celui-ci ait besoin de les détailler dans chaque prompt. L'outil se connecte aux services Google existants pour capter les habitudes, les goûts et le style propre à chaque compte. L'intégration clé repose sur Google Photos : les images personnelles de l'utilisateur, ses proches, ses animaux ou ses souvenirs, servent désormais de référence directe pour enrichir les créations générées. Quelques mots suffisent là où il fallait auparavant rédiger des descriptions minutieuses et multiplier les essais.

L'impact est immédiat pour les utilisateurs réguliers de Gemini, qui perdaient jusqu'ici un temps considérable à expliquer leurs intentions créatives à l'outil. En déléguant une partie de ce travail à la machine, Google réduit la friction entre l'idée et le résultat. L'utilisateur peut se mettre en scène dans des styles variés, du dessin au fusain à la peinture numérique, avec un rendu ancré dans sa propre réalité visuelle plutôt que dans des généralités. Le contrôle reste entre ses mains : si une image ne convient pas, il peut corriger une instruction, changer de référence, et affiner le rendu sans repartir de zéro. L'outil affiche également les sources utilisées pour chaque génération, ce qui apporte une forme de transparence sur le processus.

Cette évolution s'inscrit dans une tendance lourde de l'IA générative : personnaliser toujours davantage l'expérience en exploitant les données numériques de l'utilisateur. Google précise que les photos personnelles ne servent pas directement à entraîner ses modèles et que l'activation des connexions reste sous contrôle de l'utilisateur. Mais plus l'outil devient précis et contextuel, plus il repose sur une empreinte numérique intime, ce qui soulève des questions durables sur la vie privée et la dépendance aux écosystèmes propriétaires. La course à la personnalisation oppose désormais Google à des acteurs comme Adobe Firefly ou Midjourney, qui développent eux aussi des fonctionnalités d'adaptation au style personnel. Personal Intelligence représente cependant un avantage structurel pour Google, qui dispose déjà d'une masse de données utilisateur sans équivalent via Photos, Search ou Gmail.

Impact France/UE

L'exploitation de données personnelles intimes (photos, historique) par Gemini pour personnaliser les créations soulève des questions de conformité RGPD directement applicables aux utilisateurs français et européens.

Dans nos dossiers

Gemini

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Ars Technica AI

« Nano Banana 2 Lite » de Google : son nouveau modèle d'image, le plus rapide et le moins cher à ce jour

Google DeepMind a dévoilé Nano Banana 2 Lite, son nouveau modèle de génération d'images, présenté comme le plus rapide et le moins coûteux de sa gamme. Techniquement baptisé Gemini 3.1 Flash Lite Image, il appartient à la famille Gemini 3.1 et est disponible dès aujourd'hui sur l'ensemble de l'écosystème Google. Sa principale promesse est de produire des images en une fraction du temps requis par les modèles plus lourds de l'entreprise, tout en conservant une qualité proche de celle des versions standard. Pour étayer cette affirmation, Google s'appuie sur des scores Elo issus de la plateforme Arena.ai, qui montrent que les utilisateurs évaluent les résultats de Nano Banana 2 Lite presque aussi favorablement que ceux des versions non allégées du modèle. Cette nouveauté répond à un problème concret du secteur : les modèles d'image les plus qualitatifs sont généralement lents et onéreux, ce qui freine leur usage pour des tâches d'itération rapide. En misant sur la vitesse et le faible coût, Google cible explicitement les usages de prototypage et d'exploration créative, où la rapidité d'exécution compte davantage que la perfection du rendu final. Pour les développeurs et créateurs qui génèrent de nombreuses variantes avant de retenir une image définitive, ce gain de réactivité peut réduire significativement les coûts d'infrastructure et accélérer les flux de travail créatifs. Google reconnaît toutefois des limites : le modèle peine davantage avec le texte intégré aux images, en particulier les caractères de petite taille, et les infographies générées contiennent plus souvent des données erronées. La cohérence des personnages et des visages d'une génération à l'autre reste également moins fiable que sur les modèles complets. Ces compromis illustrent une tendance plus large du secteur de l'IA générative, où les éditeurs déclinent désormais leurs modèles phares en versions allégées afin de répondre à des besoins différenciés selon les usages, qu'il s'agisse de production finale soignée ou de simple exploration d'idées à grande échelle.

CréationActu

1 source

2Le Big Data

Fini les compromis ? Nano Banana 2 et Pro débarquent sur Gemini API

Google a rendu disponibles en accès général, le 28 mai 2026, deux nouveaux modèles de génération d'images sur sa Gemini API : Nano Banana 2 et Nano Banana Pro. L'écosystème Nano Banana, qui désigne les capacités natives de génération d'images intégrées à Gemini, compte désormais trois modèles distincts. Le premier, Nano Banana, s'appuie sur Gemini 2.5 Flash Image et privilégie la vitesse. Le deuxième, Nano Banana 2, repose sur Gemini 3.1 Flash Image et cible les usages à fort volume de requêtes. Le troisième, Nano Banana Pro, exploite Gemini 3.1 Pro Image et vise la création d'assets visuels professionnels. Tous fonctionnent de manière conversationnelle : un développeur peut générer une image, la modifier et l'affiner au fil des échanges textuels, sans quitter l'environnement de l'API. Cette mise à disposition en production change concrètement la donne pour les équipes techniques. Jusqu'ici, les développeurs devaient souvent arbitrer entre vitesse et qualité selon l'outil disponible. Avec trois niveaux de performances accessibles depuis une même interface, ils peuvent désormais adapter le modèle au contexte : prototypage rapide, production massive ou création soignée. Nano Banana 2 intéresse particulièrement les plateformes e-commerce, les outils de contenu ou les applications créatives qui génèrent des volumes importants de visuels. Nano Banana Pro, lui, bénéficie d'un mécanisme de raisonnement avancé qui lui permet de mieux interpréter des consignes complexes et de restituer du texte plus fidèle à l'intérieur des images, un point critique pour les campagnes marketing ou les assets de marque. Cette annonce s'inscrit dans une compétition intense sur le marché de la génération d'images par API, où Google affronte directement OpenAI avec DALL-E et son intégration dans GPT-4o, ainsi que Stability AI et Midjourney côté créatif. Google mise sur l'intégration native dans son écosystème Gemini comme avantage différenciant, évitant aux développeurs de multiplier les fournisseurs. Le passage en disponibilité générale signale que ces modèles sont désormais stables et prêts pour des environnements de production, ce qui accélère leur adoption dans des projets à grande échelle. La prochaine étape logique sera de voir si Google propose une tarification compétitive par rapport aux alternatives, et dans quelle mesure Nano Banana Pro peut réellement rivaliser avec les modèles spécialisés sur la fidélité créative.

UELes développeurs et entreprises européennes peuvent désormais intégrer trois niveaux de génération d'images via une API unifiée Gemini, réduisant la dépendance à plusieurs fournisseurs distincts.

💬 Enfin trois niveaux distincts depuis une même API, sans jongler entre fournisseurs, c'est ce qu'on attendait côté infra. Flash pour le volume, Pro pour les assets soignés, et tout ça dans l'écosystème Gemini, ça va convaincre des équipes qui n'ont pas envie de gérer cinq clés API différentes. Le vrai test reste le prix, et si le Pro peut vraiment tenir face à Midjourney sur un brief de campagne sérieux.

CréationOpinion

1 source

3Le Big Data

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.

OpenAI a déployé discrètement GPT-Image-2 le 21 avril 2026, sans conférence de presse ni annonce officielle de Sam Altman, directement sur les comptes ChatGPT web et mobile de ses utilisateurs dans le monde entier. Ce nouveau moteur de génération d'images représente un saut qualitatif majeur par rapport à son prédécesseur sur trois dimensions précises : le rendu de texte, la gestion de compositions complexes et le photoréalisme. Les premiers tests diffusés sur X montrent des affiches de films avec une typographie parfaitement lisible, des maquettes de Unes du New York Times où chaque colonne et chaque ligne de crédit est nette, et surtout une grille 10x10 contenant 100 objets distincts commençant par la lettre A, chacun correctement nommé et illustré sans aucune erreur de cohérence visuelle ou textuelle. Ces avancées changent concrètement ce que les professionnels peuvent faire avec l'IA générative. Jusqu'ici, intégrer du texte lisible dans une image produite par IA relevait de la loterie : les modèles produisaient systématiquement des caractères déformés, illisibles, mélangés à du pixel noise. Avec GPT-Image-2, cette limite disparaît, ce qui ouvre des usages immédiatement opérationnels pour les designers graphiques, les équipes marketing et les créateurs de contenu : prototypage d'interfaces, création d'affiches, génération de visuels publicitaires avec du texte intégré, le tout en quelques secondes et sans retouche. La gestion de la complexité spatiale, illustrée par la grille 10x10, signifie également que le modèle peut produire des compositions denses et structurées sans perte de cohérence, là où Midjourney et les outils de Google montrent encore des limites significatives dès que la scène se complique. Ce lancement silencieux un mardi s'inscrit dans une stratégie qui n'est pas anodine. Plusieurs observateurs notent que ce type de déploiement discret précède souvent, chez OpenAI, une annonce plus massive dans les jours suivants, des rumeurs évoquent une présentation liée à GPT-5.5 dès jeudi. GPT-Image-2 est par ailleurs le moteur qui alimente déjà l'API Images d'OpenAI depuis quelques semaines, utilisé notamment par des applications tierces comme ChatGPT Canvas et certains outils Canva. Son ouverture progressive au grand public via ChatGPT marque une étape de maturité : le modèle sort du contexte développeur pour entrer dans l'usage quotidien de masse. La concurrence, notamment Midjourney, qui n'a toujours pas de produit web grand public stable, et Adobe Firefly, va devoir répondre à un outil qui combine désormais photoréalisme, précision textuelle et gestion de la complexité dans un seul package accessible à tous.

UELes designers et équipes marketing français et européens peuvent immédiatement intégrer cet outil à leurs workflows pour générer des visuels avec texte lisible intégré, sans retouche manuelle.

💬 Le rendu de texte dans les images IA, c'était le dernier gros problème non résolu. GPT-Image-2 le ferme pour de bon : grille 10x10 sans une seule erreur, affiches avec typo lisible au premier coup d'oeil, c'est le genre de démo qui change ce qu'on peut promettre à un client dès demain matin. Midjourney n'a toujours pas de produit web stable, là ils vont vraiment souffrir.

CréationOpinion

1 source

4The Information AI

OpenAI s'attaque à Google avec son nouveau modèle d'image

OpenAI prépare discrètement un nouveau modèle de génération d'images, officieusement baptisé "gpt-image-2" par la communauté en ligne. Depuis plusieurs semaines, des images produites par ce modèle circulent sur X et Reddit, repérées par des utilisateurs attentifs qui ont identifié des tests en cours auprès d'une sélection de comptes ChatGPT et sur des plateformes de classement anonymes. Les résultats sont frappants : les images générées atteignent un niveau de photoréalisme tel qu'elles sont, dans certains cas, pratiquement impossibles à distinguer de photographies authentiques. L'enjeu dépasse largement la prouesse technique. OpenAI vise explicitement 1 milliard d'utilisateurs actifs hebdomadaires sur ChatGPT, un seuil symbolique que l'entreprise espérait franchir avant fin 2025. Elle a manqué cet objectif et stagne depuis dans une fourchette autour de 920 millions d'utilisateurs par semaine. Un modèle d'image nettement supérieur aux solutions existantes pourrait constituer le levier capable de débloquer cette croissance, en attirant une nouvelle vague d'utilisateurs grand public, créatifs et professionnels, qui restent encore sur des outils concurrents comme Midjourney ou les offres de Google. La bataille des modèles d'image s'intensifie à mesure que les grands acteurs de l'IA cherchent à consolider leur position. Google, avec Imagen, et les plateformes spécialisées font face à une OpenAI qui cherche à intégrer toujours davantage de capacités directement dans ChatGPT pour en faire un point d'entrée unique. Le lancement officiel de gpt-image-2 n'a pas encore été annoncé, mais la stratégie de tests progressifs suggère une sortie imminente. Si le modèle tient ses promesses de photoréalisme à grande échelle, il pourrait redistribuer significativement les parts de marché dans un secteur où la qualité visuelle est devenue le principal critère de différenciation.

CréationOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic