Aller au contenu principal
Avec cette nouveauté, Nano Banana 2 comprend vos goûts mieux que vous-même
CréationLe Big Data7sem

Avec cette nouveauté, Nano Banana 2 comprend vos goûts mieux que vous-même

Résumé IASource uniqueImpact UE
Source originale ↗·

Google a annoncé le 16 avril 2026 le lancement de Personal Intelligence, une nouvelle fonctionnalité intégrée à Gemini, son générateur d'images propulsé par intelligence artificielle. Concrètement, cette mise à jour permet à Gemini de comprendre les préférences et les centres d'intérêt d'un utilisateur sans que celui-ci ait besoin de les détailler dans chaque prompt. L'outil se connecte aux services Google existants pour capter les habitudes, les goûts et le style propre à chaque compte. L'intégration clé repose sur Google Photos : les images personnelles de l'utilisateur, ses proches, ses animaux ou ses souvenirs, servent désormais de référence directe pour enrichir les créations générées. Quelques mots suffisent là où il fallait auparavant rédiger des descriptions minutieuses et multiplier les essais.

L'impact est immédiat pour les utilisateurs réguliers de Gemini, qui perdaient jusqu'ici un temps considérable à expliquer leurs intentions créatives à l'outil. En déléguant une partie de ce travail à la machine, Google réduit la friction entre l'idée et le résultat. L'utilisateur peut se mettre en scène dans des styles variés, du dessin au fusain à la peinture numérique, avec un rendu ancré dans sa propre réalité visuelle plutôt que dans des généralités. Le contrôle reste entre ses mains : si une image ne convient pas, il peut corriger une instruction, changer de référence, et affiner le rendu sans repartir de zéro. L'outil affiche également les sources utilisées pour chaque génération, ce qui apporte une forme de transparence sur le processus.

Cette évolution s'inscrit dans une tendance lourde de l'IA générative : personnaliser toujours davantage l'expérience en exploitant les données numériques de l'utilisateur. Google précise que les photos personnelles ne servent pas directement à entraîner ses modèles et que l'activation des connexions reste sous contrôle de l'utilisateur. Mais plus l'outil devient précis et contextuel, plus il repose sur une empreinte numérique intime, ce qui soulève des questions durables sur la vie privée et la dépendance aux écosystèmes propriétaires. La course à la personnalisation oppose désormais Google à des acteurs comme Adobe Firefly ou Midjourney, qui développent eux aussi des fonctionnalités d'adaptation au style personnel. Personal Intelligence représente cependant un avantage structurel pour Google, qui dispose déjà d'une masse de données utilisateur sans équivalent via Photos, Search ou Gmail.

Impact France/UE

L'exploitation de données personnelles intimes (photos, historique) par Gemini pour personnaliser les créations soulève des questions de conformité RGPD directement applicables aux utilisateurs français et européens.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Fini les compromis ? Nano Banana 2 et Pro débarquent sur Gemini API
1Le Big Data 

Fini les compromis ? Nano Banana 2 et Pro débarquent sur Gemini API

Google a rendu disponibles en accès général, le 28 mai 2026, deux nouveaux modèles de génération d'images sur sa Gemini API : Nano Banana 2 et Nano Banana Pro. L'écosystème Nano Banana, qui désigne les capacités natives de génération d'images intégrées à Gemini, compte désormais trois modèles distincts. Le premier, Nano Banana, s'appuie sur Gemini 2.5 Flash Image et privilégie la vitesse. Le deuxième, Nano Banana 2, repose sur Gemini 3.1 Flash Image et cible les usages à fort volume de requêtes. Le troisième, Nano Banana Pro, exploite Gemini 3.1 Pro Image et vise la création d'assets visuels professionnels. Tous fonctionnent de manière conversationnelle : un développeur peut générer une image, la modifier et l'affiner au fil des échanges textuels, sans quitter l'environnement de l'API. Cette mise à disposition en production change concrètement la donne pour les équipes techniques. Jusqu'ici, les développeurs devaient souvent arbitrer entre vitesse et qualité selon l'outil disponible. Avec trois niveaux de performances accessibles depuis une même interface, ils peuvent désormais adapter le modèle au contexte : prototypage rapide, production massive ou création soignée. Nano Banana 2 intéresse particulièrement les plateformes e-commerce, les outils de contenu ou les applications créatives qui génèrent des volumes importants de visuels. Nano Banana Pro, lui, bénéficie d'un mécanisme de raisonnement avancé qui lui permet de mieux interpréter des consignes complexes et de restituer du texte plus fidèle à l'intérieur des images, un point critique pour les campagnes marketing ou les assets de marque. Cette annonce s'inscrit dans une compétition intense sur le marché de la génération d'images par API, où Google affronte directement OpenAI avec DALL-E et son intégration dans GPT-4o, ainsi que Stability AI et Midjourney côté créatif. Google mise sur l'intégration native dans son écosystème Gemini comme avantage différenciant, évitant aux développeurs de multiplier les fournisseurs. Le passage en disponibilité générale signale que ces modèles sont désormais stables et prêts pour des environnements de production, ce qui accélère leur adoption dans des projets à grande échelle. La prochaine étape logique sera de voir si Google propose une tarification compétitive par rapport aux alternatives, et dans quelle mesure Nano Banana Pro peut réellement rivaliser avec les modèles spécialisés sur la fidélité créative.

UELes développeurs et entreprises européennes peuvent désormais intégrer trois niveaux de génération d'images via une API unifiée Gemini, réduisant la dépendance à plusieurs fournisseurs distincts.

💬 Enfin trois niveaux distincts depuis une même API, sans jongler entre fournisseurs, c'est ce qu'on attendait côté infra. Flash pour le volume, Pro pour les assets soignés, et tout ça dans l'écosystème Gemini, ça va convaincre des équipes qui n'ont pas envie de gérer cinq clés API différentes. Le vrai test reste le prix, et si le Pro peut vraiment tenir face à Midjourney sur un brief de campagne sérieux.

CréationOpinion
1 source
GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.
2Le Big Data 

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.

OpenAI a déployé discrètement GPT-Image-2 le 21 avril 2026, sans conférence de presse ni annonce officielle de Sam Altman, directement sur les comptes ChatGPT web et mobile de ses utilisateurs dans le monde entier. Ce nouveau moteur de génération d'images représente un saut qualitatif majeur par rapport à son prédécesseur sur trois dimensions précises : le rendu de texte, la gestion de compositions complexes et le photoréalisme. Les premiers tests diffusés sur X montrent des affiches de films avec une typographie parfaitement lisible, des maquettes de Unes du New York Times où chaque colonne et chaque ligne de crédit est nette, et surtout une grille 10x10 contenant 100 objets distincts commençant par la lettre A, chacun correctement nommé et illustré sans aucune erreur de cohérence visuelle ou textuelle. Ces avancées changent concrètement ce que les professionnels peuvent faire avec l'IA générative. Jusqu'ici, intégrer du texte lisible dans une image produite par IA relevait de la loterie : les modèles produisaient systématiquement des caractères déformés, illisibles, mélangés à du pixel noise. Avec GPT-Image-2, cette limite disparaît, ce qui ouvre des usages immédiatement opérationnels pour les designers graphiques, les équipes marketing et les créateurs de contenu : prototypage d'interfaces, création d'affiches, génération de visuels publicitaires avec du texte intégré, le tout en quelques secondes et sans retouche. La gestion de la complexité spatiale, illustrée par la grille 10x10, signifie également que le modèle peut produire des compositions denses et structurées sans perte de cohérence, là où Midjourney et les outils de Google montrent encore des limites significatives dès que la scène se complique. Ce lancement silencieux un mardi s'inscrit dans une stratégie qui n'est pas anodine. Plusieurs observateurs notent que ce type de déploiement discret précède souvent, chez OpenAI, une annonce plus massive dans les jours suivants, des rumeurs évoquent une présentation liée à GPT-5.5 dès jeudi. GPT-Image-2 est par ailleurs le moteur qui alimente déjà l'API Images d'OpenAI depuis quelques semaines, utilisé notamment par des applications tierces comme ChatGPT Canvas et certains outils Canva. Son ouverture progressive au grand public via ChatGPT marque une étape de maturité : le modèle sort du contexte développeur pour entrer dans l'usage quotidien de masse. La concurrence, notamment Midjourney, qui n'a toujours pas de produit web grand public stable, et Adobe Firefly, va devoir répondre à un outil qui combine désormais photoréalisme, précision textuelle et gestion de la complexité dans un seul package accessible à tous.

UELes designers et équipes marketing français et européens peuvent immédiatement intégrer cet outil à leurs workflows pour générer des visuels avec texte lisible intégré, sans retouche manuelle.

💬 Le rendu de texte dans les images IA, c'était le dernier gros problème non résolu. GPT-Image-2 le ferme pour de bon : grille 10x10 sans une seule erreur, affiches avec typo lisible au premier coup d'oeil, c'est le genre de démo qui change ce qu'on peut promettre à un client dès demain matin. Midjourney n'a toujours pas de produit web stable, là ils vont vraiment souffrir.

CréationOpinion
1 source
OpenAI s'attaque à Google avec son nouveau modèle d'image
3The Information AI 

OpenAI s'attaque à Google avec son nouveau modèle d'image

OpenAI prépare discrètement un nouveau modèle de génération d'images, officieusement baptisé "gpt-image-2" par la communauté en ligne. Depuis plusieurs semaines, des images produites par ce modèle circulent sur X et Reddit, repérées par des utilisateurs attentifs qui ont identifié des tests en cours auprès d'une sélection de comptes ChatGPT et sur des plateformes de classement anonymes. Les résultats sont frappants : les images générées atteignent un niveau de photoréalisme tel qu'elles sont, dans certains cas, pratiquement impossibles à distinguer de photographies authentiques. L'enjeu dépasse largement la prouesse technique. OpenAI vise explicitement 1 milliard d'utilisateurs actifs hebdomadaires sur ChatGPT, un seuil symbolique que l'entreprise espérait franchir avant fin 2025. Elle a manqué cet objectif et stagne depuis dans une fourchette autour de 920 millions d'utilisateurs par semaine. Un modèle d'image nettement supérieur aux solutions existantes pourrait constituer le levier capable de débloquer cette croissance, en attirant une nouvelle vague d'utilisateurs grand public, créatifs et professionnels, qui restent encore sur des outils concurrents comme Midjourney ou les offres de Google. La bataille des modèles d'image s'intensifie à mesure que les grands acteurs de l'IA cherchent à consolider leur position. Google, avec Imagen, et les plateformes spécialisées font face à une OpenAI qui cherche à intégrer toujours davantage de capacités directement dans ChatGPT pour en faire un point d'entrée unique. Le lancement officiel de gpt-image-2 n'a pas encore été annoncé, mais la stratégie de tests progressifs suggère une sortie imminente. Si le modèle tient ses promesses de photoréalisme à grande échelle, il pourrait redistribuer significativement les parts de marché dans un secteur où la qualité visuelle est devenue le principal critère de différenciation.

CréationOpinion
1 source
Cette IA vous permet de créer des jeux vidéo à partir de Google Maps, mais il y a une condition
4Presse-citron 

Cette IA vous permet de créer des jeux vidéo à partir de Google Maps, mais il y a une condition

En mai 2026, Google a annoncé l'intégration de Genie, son modèle d'IA générative spécialisé dans la création d'environnements de jeux vidéo, avec Google Maps. Concrètement, les utilisateurs peuvent désormais soumettre n'importe quel lieu du monde réel à Genie, qui s'appuie sur les données de Street View pour générer un environnement jouable inspiré de cet endroit. Un quartier de Tokyo, une rue de Lisbonne ou un village alpin peuvent ainsi devenir le décor d'un jeu vidéo en quelques instants. La fonctionnalité est également disponible à l'international, mais Google en réserve l'accès aux abonnés du tier le plus élevé de ses services. Cette capacité représente une rupture potentielle dans la chaîne de création de jeux vidéo, traditionnellement coûteuse et chronophage. Les développeurs indépendants et les studios de petite taille pourraient désormais s'appuyer sur des données géographiques réelles pour construire des univers crédibles sans budget de modélisation 3D. La restriction aux abonnements premium limite toutefois considérablement la démocratisation effective de l'outil, et soulève la question de qui bénéficiera réellement de cette avancée. Genie avait été présenté par Google DeepMind comme un "modèle du monde" capable de générer des environnements interactifs à partir d'une seule image ou d'une description textuelle. Son couplage avec Street View, qui couvre plus de 220 pays et territoires, démultiplie théoriquement son potentiel créatif. En monétisant la fonctionnalité via un abonnement premium, Google teste la viabilité économique de l'IA générative appliquée au secteur du jeu vidéo, tout en positionnant Maps comme une infrastructure créative au-delà de la simple navigation.

UELes développeurs indépendants et studios européens pourraient réduire leurs coûts de modélisation en s'appuyant sur des données géographiques réelles, mais l'accès réservé aux abonnements premium de Google en limite concrètement la portée pour la majorité des acteurs du secteur.

CréationOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour