Le générateur d'images d'OpenAI peut désormais…

55

1The Verge AI

Gemini peut désormais accéder à Google Photos pour générer des images personnalisées

Google a déployé une nouvelle fonctionnalité pour son assistant Gemini, lui permettant désormais de puiser dans les données de Google Photos pour générer des images personnalisées. Baptisée "Personal Intelligence", cette intégration s'appuie sur le modèle de génération d'images Nano Banana 2 et donne accès au contenu des applications Google connectées au compte de l'utilisateur. Concrètement, des requêtes comme "Dessine ma maison de rêve" ou "Crée une image de mes essentiels sur une île déserte" produisent des visuels automatiquement adaptés aux goûts et au style de vie de la personne, selon Google dans son billet de blog officiel. L'impact est significatif pour les utilisateurs de l'écosystème Google : pour la première fois, un assistant IA grand public génère des images non pas à partir d'une description textuelle abstraite, mais à partir de données réelles et personnelles. Le système analyse les étiquettes et métadonnées présentes dans Google Photos pour identifier l'utilisateur, ses proches et ses habitudes visuelles. Cela transforme Gemini d'un générateur d'images générique en un outil de création véritablement contextualisé. Cette fonctionnalité s'inscrit dans la stratégie plus large de Google visant à différencier Gemini face à des concurrents comme ChatGPT ou Claude, en exploitant son avantage unique : une base d'utilisateurs déjà massivement ancrée dans ses services. L'accès aux données personnelles pour alimenter l'IA soulève néanmoins des questions de confidentialité que Google devra adresser, notamment dans le contexte réglementaire européen où de telles pratiques font l'objet d'une surveillance accrue.

UEL'utilisation de données personnelles (Google Photos) pour alimenter la génération d'images soulève des questions de conformité au RGPD et pourrait attirer l'attention des autorités de protection des données européennes, notamment la CNIL.

💬 Honnêtement, c'est un pas en avant intéressant pour Gemini. Enfin, on passe d'une simple description textuelle pour obtenir une image à une génération visuelle contextualisée, c'est plus prometteur. Google exploite son écosystème de données personnelles pour donner vie à des créations plus pertinentes. Cependant, il faudra que Google soit transparent sur la manière dont ces données sont utilisées et protégées, surtout avec le RGPD en jeu. Reste à voir si cette "Personnal Intelligence" tiendra la route face aux critiques de confidentialité.

CréationOutil

1 source

Muse Image : Meta lance son générateur d’« AI slop » maison

44

2Next INpact

Muse Image : Meta lance son générateur d’« AI slop » maison

Meta a dévoilé Muse Image, son nouveau générateur d'images par intelligence artificielle, qui sera déployé en priorité sur Instagram et WhatsApp avant d'arriver sur Facebook, Messenger et les outils publicitaires du groupe. Le modèle permet de créer des visuels à partir d'une simple requête textuelle ou d'une photo existante, avec des fonctions d'édition pour ajouter ou supprimer des éléments. Muse Image propose également des suggestions de retouches, de la colorisation de photos anciennes jusqu'à des transformations plus insolites comme changer l'apparence des personnes en pâte à modeler. L'outil sait aussi meubler virtuellement une pièce avec des objets vendus en ligne, et alimente 30 nouveaux effets IA dans les Stories Instagram ainsi que la génération d'images directement dans les conversations WhatsApp via Meta AI. Une fonctionnalité permet en outre d'intégrer un autre utilisateur d'Instagram dans une image générée simplement en le taguant dans la requête, le modèle reproduisant alors une photo publique de cette personne. Pour l'instant, Muse Image reste limité aux États-Unis avant une extension internationale, et son usage courant est gratuit, les besoins plus intensifs nécessitant un abonnement payant chez Meta. Cette annonce illustre la stratégie de Meta consistant à intégrer massivement la génération d'images par IA dans ses réseaux sociaux, au risque d'accélérer la production de contenus de faible qualité, souvent qualifiés d'« AI slop ». La fonction permettant de reproduire l'apparence d'un utilisateur à partir d'une simple mention pose un problème de confidentialité évident, ouvrant la voie à des dérives comme les photos truquées ou les deepfakes, même si Meta rappelle que des réglages permettent de bloquer la réutilisation des contenus publics d'un compte. Pour l'industrie, cette sortie confirme aussi l'intensification de la concurrence sur la génération d'images, où Meta cherche à se hisser au niveau de OpenAI, Google, Microsoft, xAI ou Recraft/Reve, sans toutefois les dépasser selon les classements Arena AI du 5 juillet. Sur le plan technique, Muse Image fonctionne comme un agent capable de rechercher des références visuelles en ligne pour ancrer ses créations dans des informations factuelles, tout en collaborant avec Muse Spark pour planifier des tâches. Meta explique que les résultats s'améliorent avec un temps de calcul plus long, le modèle affinant son raisonnement plutôt que de simplement générer plusieurs images pour ne garder que la meilleure. Cette annonce s'accompagne du dévoilement de Muse Video, présenté comme le modèle de génération vidéo le plus avancé développé par le groupe, promettant un suivi précis des requêtes et une composition à partir de plusieurs références. Ces lancements traduisent les investissements massifs consentis par Meta Superintelligence Labs pour rattraper son retard face aux ténors du secteur, dans un contexte où la question du filigrane et de l'identification des contenus générés par IA reste un enjeu de conformité aux standards du secteur.

UEMuse Image reste pour l'instant limité aux États-Unis sans déploiement en France/UE, mais sa fonctionnalité de reproduction du visage d'un utilisateur via simple mention soulèverait des questions de conformité RGPD en cas d'extension européenne.

💬 Meta appelle carrément son propre outil un générateur d'« AI slop », ça en dit long sur l'état du game. Ce qui m'inquiète, c'est pas la qualité des rendus mais la fonction où tu tagues quelqu'un et l'IA reconstruit son visage à partir de ses photos publiques : selon Le Fil IA, Meta vient de faire du deepfake par défaut une fonctionnalité grand public plutôt qu'une dérive à combattre. Reste à voir si le RGPD calme l'ambition une fois que ça débarque en Europe.

CréationOpinion

1 source

Reve 1.5 : une entrée en 4K dans le haut de gamme des générateurs d’images

41

3Le Big Data

Reve 1.5 : une entrée en 4K dans le haut de gamme des générateurs d’images

Reve AI, startup spécialisée dans la génération d'images par intelligence artificielle, a lancé Reve 1.5, son modèle de nouvelle génération capable de produire des visuels en résolution 4K. Cette version s'inscrit dans la continuité de Reve Image 1.0, sorti en 2025 et salué dès ses débuts pour sa cohérence visuelle et son réalisme. Reve 1.5 mise sur un équilibre entre qualité de rendu, rapidité de génération et fidélité au prompt, avec des temps de création jugés très compétitifs dans les tests indépendants. La plateforme intègre nativement des outils de génération de texte dans l'image, d'édition et de remix, le tout via une interface accessible aux utilisateurs non techniques. Pour les créateurs professionnels et les studios qui intègrent la génération d'images dans leurs workflows, Reve 1.5 représente une alternative crédible aux solutions dominantes. Là où d'autres modèles peinent avec la cohérence spatiale, proportions des personnages, logique des environnements, absence de détails incongrus, Reve 1.5 se distingue par des scènes structurées et visuellement stables. La résolution 4K ouvre par ailleurs la porte à des usages éditoriaux et publicitaires qui nécessitent des fichiers haute définition exploitables sans retraitement. Son positionnement haut de gamme, couplé à une interface simple, élargit le spectre des utilisateurs potentiels au-delà des seuls experts en prompting. Le marché de la génération d'images s'est considérablement durci entre 2024 et 2025, avec OpenAI, Google, Black Forest Labs (auteur du modèle FLUX) et Midjourney qui dominent les benchmarks et captent l'essentiel des usages. Reve AI n'ambitionne pas de détrôner ces acteurs, mais de s'installer durablement comme une référence crédible pour les créateurs qui cherchent un outil fiable, précis et régulièrement mis à jour. La startup affiche une limite assumée sur les styles artistiques, les imitations de Van Gogh ou de l'impressionnisme restent approximatives, une prudence que certains observateurs lisent comme un choix déontologique pour éviter la reproduction trop fidèle d'œuvres protégées. Avec Reve 1.5, l'entreprise franchit une étape significative en cohérence et en niveau de détail, et prépare le terrain pour des versions futures dans un secteur où le rythme d'innovation ne laisse aucune place à l'immobilisme.

UEOutil accessible aux créateurs français et européens pour leurs workflows de production visuelle, sans impact réglementaire ou institutionnel spécifique à la France ou à l'UE.

CréationOutil

1 source

50

4Latent Space

OpenAI lance GPT-Image-2

OpenAI a lancé GPT-Image-2 les 20 et 21 avril 2026, déployant simultanément le modèle sur ChatGPT, Codex et son API publique. La nouvelle version introduit deux variantes, l'une standard et l'une dotée d'un mode "thinking", ce dernier permettant au modèle de générer plusieurs candidats, de vérifier ses propres sorties et d'interroger le web lorsqu'il est couplé à un modèle de raisonnement. Les capacités mises en avant incluent le rendu de texte, la fidélité aux mises en page, l'édition d'images, le support multilingue et la génération d'artefacts visuels tels que diapositives, infographies, maquettes d'interface et QR codes. Sur les benchmarks Arena, GPT-Image-2 occupe la première place dans toutes les catégories de génération d'images : 1512 points en texte-vers-image, 1513 en édition mono-image, 1464 en édition multi-images, avec une avance de 242 points Elo sur le modèle suivant dans la catégorie texte-vers-image. Des outils tiers comme Figma, Canva, Adobe Firefly et fal ont déjà annoncé son intégration. Ce lancement représente davantage qu'une amélioration esthétique : GPT-Image-2 positionne la génération d'images comme une surface de travail professionnelle à part entière. Les réactions des développeurs convergent sur un point précis, le modèle est suffisamment fiable pour servir de référence visuelle dans des boucles de conception, de documentation technique et de prototypage d'interface. L'implication la plus structurante est que la génération d'images devient une porte d'entrée pour les agents de code : un développeur peut générer une maquette visuelle puis demander à Codex de l'implémenter directement, en utilisant l'image comme spécification. Ce flux de travail, jusqu'ici trop peu fiable pour être systématisé, devient crédible avec ce niveau de précision. Le lancement survient dans un contexte de recentrage stratégique chez OpenAI. Selon plusieurs sources, une période de concentration interne aurait précédé cette sortie, associée au départ ou à la réorganisation de l'équipe Sora, le projet de génération vidéo. Le fait que la génération d'images reste une priorité malgré ces turbulences est en soi significatif. En parallèle, d'autres acteurs avancent sur le terrain des agents : Hugging Face a présenté ml-intern, un agent open source automatisant l'ensemble de la boucle de recherche post-entraînement, avec des résultats publiés sur des benchmarks scientifiques comme GPQA, où les performances sont passées de 10% à 32% en moins de dix heures sur Qwen3-1.7B. Le même jour, Cursor aurait bouclé un accord à 60 milliards de dollars avec xAI. La semaine du 20 avril 2026 s'annonce comme l'une des plus denses de l'année en matière d'IA appliquée.

UEL'accès immédiat à l'API renforce la dépendance des entreprises et créatifs européens aux infrastructures américaines pour la génération d'images professionnelle.

CréationOpinion

1 source

Le générateur d'images d'OpenAI peut désormais interroger le web

À lire aussi

Gemini peut désormais accéder à Google Photos pour générer des images personnalisées

Muse Image : Meta lance son générateur d’« AI slop » maison

Reve 1.5 : une entrée en 4K dans le haut de gamme des générateurs d’images

OpenAI lance GPT-Image-2