Aller au contenu principal
CréationArs Technica AI1h· 1 min de lecture

« Nano Banana 2 Lite » de Google : son nouveau modèle d'image, le plus rapide et le moins cher à ce jour

Résumé IASources croisées · 2Impact UE
Source originale ↗·
Egalement couvert par :TechCrunch AI

Google DeepMind a dévoilé Nano Banana 2 Lite, son nouveau modèle de génération d'images, présenté comme le plus rapide et le moins coûteux de sa gamme. Techniquement baptisé Gemini 3.1 Flash Lite Image, il appartient à la famille Gemini 3.1 et est disponible dès aujourd'hui sur l'ensemble de l'écosystème Google. Sa principale promesse est de produire des images en une fraction du temps requis par les modèles plus lourds de l'entreprise, tout en conservant une qualité proche de celle des versions standard. Pour étayer cette affirmation, Google s'appuie sur des scores Elo issus de la plateforme Arena.ai, qui montrent que les utilisateurs évaluent les résultats de Nano Banana 2 Lite presque aussi favorablement que ceux des versions non allégées du modèle.

Cette nouveauté répond à un problème concret du secteur : les modèles d'image les plus qualitatifs sont généralement lents et onéreux, ce qui freine leur usage pour des tâches d'itération rapide. En misant sur la vitesse et le faible coût, Google cible explicitement les usages de prototypage et d'exploration créative, où la rapidité d'exécution compte davantage que la perfection du rendu final. Pour les développeurs et créateurs qui génèrent de nombreuses variantes avant de retenir une image définitive, ce gain de réactivité peut réduire significativement les coûts d'infrastructure et accélérer les flux de travail créatifs.

Google reconnaît toutefois des limites : le modèle peine davantage avec le texte intégré aux images, en particulier les caractères de petite taille, et les infographies générées contiennent plus souvent des données erronées. La cohérence des personnages et des visages d'une génération à l'autre reste également moins fiable que sur les modèles complets. Ces compromis illustrent une tendance plus large du secteur de l'IA générative, où les éditeurs déclinent désormais leurs modèles phares en versions allégées afin de répondre à des besoins différenciés selon les usages, qu'il s'agisse de production finale soignée ou de simple exploration d'idées à grande échelle.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

OpenAI s'attaque à Google avec son nouveau modèle d'image
1The Information AI 

OpenAI s'attaque à Google avec son nouveau modèle d'image

OpenAI prépare discrètement un nouveau modèle de génération d'images, officieusement baptisé "gpt-image-2" par la communauté en ligne. Depuis plusieurs semaines, des images produites par ce modèle circulent sur X et Reddit, repérées par des utilisateurs attentifs qui ont identifié des tests en cours auprès d'une sélection de comptes ChatGPT et sur des plateformes de classement anonymes. Les résultats sont frappants : les images générées atteignent un niveau de photoréalisme tel qu'elles sont, dans certains cas, pratiquement impossibles à distinguer de photographies authentiques. L'enjeu dépasse largement la prouesse technique. OpenAI vise explicitement 1 milliard d'utilisateurs actifs hebdomadaires sur ChatGPT, un seuil symbolique que l'entreprise espérait franchir avant fin 2025. Elle a manqué cet objectif et stagne depuis dans une fourchette autour de 920 millions d'utilisateurs par semaine. Un modèle d'image nettement supérieur aux solutions existantes pourrait constituer le levier capable de débloquer cette croissance, en attirant une nouvelle vague d'utilisateurs grand public, créatifs et professionnels, qui restent encore sur des outils concurrents comme Midjourney ou les offres de Google. La bataille des modèles d'image s'intensifie à mesure que les grands acteurs de l'IA cherchent à consolider leur position. Google, avec Imagen, et les plateformes spécialisées font face à une OpenAI qui cherche à intégrer toujours davantage de capacités directement dans ChatGPT pour en faire un point d'entrée unique. Le lancement officiel de gpt-image-2 n'a pas encore été annoncé, mais la stratégie de tests progressifs suggère une sortie imminente. Si le modèle tient ses promesses de photoréalisme à grande échelle, il pourrait redistribuer significativement les parts de marché dans un secteur où la qualité visuelle est devenue le principal critère de différenciation.

CréationOpinion
1 source
2VentureBeat AI 

Microsoft lance MAI-Image-2-Efficient, un modèle de génération d'images plus rapide et moins coûteux

Microsoft a lancé ce mardi MAI-Image-2-Efficient, une version optimisée de son modèle phare de génération d'images MAI-Image-2, disponible immédiatement sur Microsoft Foundry et MAI Playground sans liste d'attente. Le modèle est facturé 5 dollars par million de tokens texte en entrée et 19,50 dollars par million de tokens image en sortie, soit une réduction de 41 % par rapport aux 33 dollars du modèle original pour les sorties image. Sur le plan technique, il tourne 22 % plus vite que son prédécesseur et affiche une efficacité quatre fois supérieure par GPU sur du matériel NVIDIA H100 en résolution 1024×1024. Microsoft affirme également le surpasser face aux modèles concurrents de Google, notamment Gemini 3.1 Flash, Gemini 3.1 Flash Image et Gemini 3 Pro Image, avec une latence médiane (p50) inférieure de 40 % en moyenne. Le modèle est aussi en cours de déploiement dans Copilot et Bing. Cette sortie s'inscrit dans une stratégie à deux niveaux que Microsoft emprunte directement au manuel de l'industrie IA : MAI-Image-2-Efficient cible les usages industriels à fort volume et contraintes budgétaires serrées, comme la photographie produit, les créations marketing, les maquettes d'interface ou les pipelines d'assets de marque. MAI-Image-2 reste le modèle de précision pour les rendus photoréalistes exigeants, les styles complexes comme l'illustration ou l'anime, et la typographie élaborée intégrée à l'image. Cette approche duale, similaire aux déclinaisons GPT d'OpenAI, Haiku-Sonnet-Opus d'Anthropic ou Flash-Pro de Google, s'applique ici à la génération d'images, un domaine où le coût par image est souvent le facteur décisif pour un déploiement à l'échelle en production. La vitesse de cette sortie est particulièrement significative : MAI-Image-2 n'avait été lancé sur MAI Playground que le 19 mars, avec une disponibilité élargie via Microsoft Foundry le 2 avril seulement, en même temps que deux autres modèles fondationnels, MAI-Transcribe-1 (reconnaissance vocale multilingue sur 25 langues) et MAI-Voice-1 (génération audio). Moins d'un mois s'est donc écoulé entre le lancement du modèle principal et celui de sa variante optimisée. Ce rythme illustre le mode de fonctionnement de la MAI Superintelligence Team, constituée en novembre 2025 sous la direction de Mustafa Suleyman, CEO de Microsoft AI : l'équipe opère davantage comme une startup en cycle court que comme un laboratoire de recherche traditionnel. Ce virage est stratégiquement crucial pour Microsoft, qui cherche à se doter d'une pile IA autonome, moins dépendante d'OpenAI. L'accueil est jusqu'ici favorable : selon Decrypt, MAI-Image-2 avait déjà atteint la troisième place du classement Arena.ai pour la génération d'images, derrière Google et OpenAI.

UELes développeurs et entreprises européens sur Microsoft Foundry bénéficient immédiatement d'une réduction de coût de 41% pour leurs pipelines de génération d'images, sans impact réglementaire spécifique à la France ou l'UE.

CréationOpinion
1 source
Google dévoile Gemini 3.1 Flash-Lite pour générer des images d'entreprise en 4 secondes à moindre coût
3VentureBeat AI 

Google dévoile Gemini 3.1 Flash-Lite pour générer des images d'entreprise en 4 secondes à moindre coût

Google a lancé ce jour un nouveau modèle de génération d'images baptisé Nano Banana 2 Lite, officiellement désigné Gemini 3.1 Flash-Lite Image dans son API. Ce modèle est immédiatement disponible pour les développeurs entreprise via Google AI Studio, l'API Gemini et la plateforme GEAP (Gemini Enterprise Agent Platform). Sa promesse principale est double : vitesse et faible coût. Il génère une image en 4 secondes au format 1024x1024 pixels, pour un tarif fixe de 0,034 dollar par tranche de mille images. Construit sur l'architecture Gemini 3.1 Flash Lite, il succède à Nano Banana 1 (Gemini 2.5 Flash Image) avec des améliorations ciblées : meilleure cohérence des personnages sur des séquences continues, rendu typographique localisé, et connaissance générale du monde renforcée pour générer des visualisations de données ou des mises en scène contextuelles. Dans les benchmarks internes, il obtient un score Elo de 1 251 en génération texte-vers-image, dépassant à la fois le modèle précédent (1 151) et même le Nano Banana Pro, plus lourd et plus coûteux (1 245). La seule limitation assumée est la résolution : contrairement aux modèles NB2 standard et NB Pro qui supportent 1k, 2k et 4k, ce modèle Lite se cantonne au 1k. L'enjeu commercial est clair. Google ne positionne pas ce modèle comme un outil créatif artistique, mais comme une couche utilitaire invisible pour les flux de travail automatisés à grand volume. Les ingénieurs logiciels, les plateformes publicitaires programmatiques et les applications de commerce numérique sont les cibles directes. Concrètement, cela signifie des milliers de variantes visuelles pour des tests A/B publicitaires en temps réel, des ajustements instantanés de visuels pour des vitrines localisées, ou encore la génération automatique d'assets pour des prototypes. À 0,034 dollar le millier d'images, le modèle change radicalement l'équation économique pour les applications qui génèrent des images à l'échelle industrielle. Cette sortie s'inscrit dans une période d'intense compétition sur le segment des modèles d'image rapides et bon marché. Google annonce également en parallèle la préversion publique de Gemini Omni Flash, un modèle multimodal orienté génération et édition vidéo conversationnelle. Nano Banana 2 Lite complète donc une offre stratifiée : d'un côté, des modèles puissants et flexibles pour la création complexe, de l'autre un moteur léger optimisé pour l'infrastructure. Le comparatif avec Krea 2 Turbo de la startup Krea est instructif : ce concurrent propose une licence partiellement ouverte et des capacités de personnalisation plus larges pour les petites entreprises, là où Google mise sur l'intégration native à son écosystème Workspace et ses offres IA d'entreprise. La bataille se joue autant sur le prix que sur l'écosystème, et Google dispose ici d'un avantage structurel considérable auprès de ses clients existants.

UELes entreprises européennes opérant à grand volume dans la publicité programmatique ou le e-commerce peuvent immédiatement réduire leurs coûts de génération d'images en adoptant ce modèle via l'API Gemini.

💬 Le calcul est simple, et c'est ça qui change tout : 0,034 dollar les mille images, c'est moins cher que de stocker les fichiers eux-mêmes. Google ne vend plus un outil créatif, il vend une commodité, comme l'électricité. Reste à voir si les boîtes de pub programmatique sautent vraiment le pas ou si elles se contentent de tester sur un coin de campagne.

CréationActu
1 source
Fini les compromis ? Nano Banana 2 et Pro débarquent sur Gemini API
4Le Big Data 

Fini les compromis ? Nano Banana 2 et Pro débarquent sur Gemini API

Google a rendu disponibles en accès général, le 28 mai 2026, deux nouveaux modèles de génération d'images sur sa Gemini API : Nano Banana 2 et Nano Banana Pro. L'écosystème Nano Banana, qui désigne les capacités natives de génération d'images intégrées à Gemini, compte désormais trois modèles distincts. Le premier, Nano Banana, s'appuie sur Gemini 2.5 Flash Image et privilégie la vitesse. Le deuxième, Nano Banana 2, repose sur Gemini 3.1 Flash Image et cible les usages à fort volume de requêtes. Le troisième, Nano Banana Pro, exploite Gemini 3.1 Pro Image et vise la création d'assets visuels professionnels. Tous fonctionnent de manière conversationnelle : un développeur peut générer une image, la modifier et l'affiner au fil des échanges textuels, sans quitter l'environnement de l'API. Cette mise à disposition en production change concrètement la donne pour les équipes techniques. Jusqu'ici, les développeurs devaient souvent arbitrer entre vitesse et qualité selon l'outil disponible. Avec trois niveaux de performances accessibles depuis une même interface, ils peuvent désormais adapter le modèle au contexte : prototypage rapide, production massive ou création soignée. Nano Banana 2 intéresse particulièrement les plateformes e-commerce, les outils de contenu ou les applications créatives qui génèrent des volumes importants de visuels. Nano Banana Pro, lui, bénéficie d'un mécanisme de raisonnement avancé qui lui permet de mieux interpréter des consignes complexes et de restituer du texte plus fidèle à l'intérieur des images, un point critique pour les campagnes marketing ou les assets de marque. Cette annonce s'inscrit dans une compétition intense sur le marché de la génération d'images par API, où Google affronte directement OpenAI avec DALL-E et son intégration dans GPT-4o, ainsi que Stability AI et Midjourney côté créatif. Google mise sur l'intégration native dans son écosystème Gemini comme avantage différenciant, évitant aux développeurs de multiplier les fournisseurs. Le passage en disponibilité générale signale que ces modèles sont désormais stables et prêts pour des environnements de production, ce qui accélère leur adoption dans des projets à grande échelle. La prochaine étape logique sera de voir si Google propose une tarification compétitive par rapport aux alternatives, et dans quelle mesure Nano Banana Pro peut réellement rivaliser avec les modèles spécialisés sur la fidélité créative.

UELes développeurs et entreprises européennes peuvent désormais intégrer trois niveaux de génération d'images via une API unifiée Gemini, réduisant la dépendance à plusieurs fournisseurs distincts.

💬 Enfin trois niveaux distincts depuis une même API, sans jongler entre fournisseurs, c'est ce qu'on attendait côté infra. Flash pour le volume, Pro pour les assets soignés, et tout ça dans l'écosystème Gemini, ça va convaincre des équipes qui n'ont pas envie de gérer cinq clés API différentes. Le vrai test reste le prix, et si le Pro peut vraiment tenir face à Midjourney sur un brief de campagne sérieux.

CréationOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic