Aller au contenu principal
Le générateur d'images d'OpenAI peut désormais interroger le web
CréationThe Verge AI51min

Le générateur d'images d'OpenAI peut désormais interroger le web

1 source couvre ce sujet·Source originale ↗·

OpenAI a déployé ChatGPT Images 2.0, une nouvelle version de son générateur d'images propulsée par le modèle GPT Image 2. La mise à jour introduit des "capacités de raisonnement" inédites : le système peut désormais interroger le web en temps réel pour enrichir ses créations visuelles à partir d'une seule invite. Ces nouvelles fonctionnalités sont réservées aux abonnés ChatGPT Plus, Pro, Business et Enterprise. En mode raisonnement activé, le générateur peut produire plusieurs images cohérentes à partir d'un même prompt, tout en améliorant le suivi des instructions, la préservation des détails choisis par l'utilisateur et la génération de texte intégré aux images.

L'intégration de la recherche web dans un générateur d'images marque un tournant significatif : cela permet au modèle d'incorporer des informations récentes et contextuelles directement dans la création visuelle, sans que l'utilisateur ait à fournir ces données manuellement. Pour les professionnels du marketing, du design ou du journalisme, cela ouvre la voie à des visuels plus précis et actualisés, générés avec moins d'effort. La capacité à produire du texte lisible dans les images reste par ailleurs l'un des défis historiques de l'IA générative, et toute amélioration dans ce domaine a une valeur pratique immédiate.

Cette annonce s'inscrit dans une course acharnée entre OpenAI, Google (Imagen) et Midjourney pour dominer le marché des générateurs d'images IA. OpenAI avait déjà surpris le secteur en mars 2025 avec l'intégration native de la génération d'images dans ChatGPT via GPT-4o. L'ajout du raisonnement et de l'accès web à la couche image prolonge cette stratégie d'unification des capacités multimodales dans un seul produit grand public, renforçant la position de ChatGPT comme plateforme centrale de l'IA générative.

Impact France/UE

Les abonnés ChatGPT Plus, Pro, Business et Enterprise en France et en Europe ont accès à ces nouvelles capacités de génération d'images enrichies par la recherche web en temps réel.

À lire aussi

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga
1VentureBeat AI 

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga

OpenAI a officiellement lancé ChatGPT Images 2.0 ce mois d'avril 2026, quelques mois seulement après la sortie de GPT-Image-1.5 en décembre 2025. Le nouveau modèle, baptisé en interne "duct tape" lors de semaines de tests discrets sur la plateforme LM Arena AI, est désormais accessible à tous les abonnés ChatGPT, tous niveaux confondus. Pour les développeurs, il est disponible via l'API sous le nom gpt-image-2. Ses capacités dépassent largement celles de son prédécesseur : génération de longs blocs de texte multilingues intégrés dans une image, création d'infographies complètes, de diapositives, de cartes, de mangas, de plans d'appartement, de grilles d'images multiples et de modèles de personnages sous différents angles. Le modèle peut également reproduire avec une fidélité troublante des interfaces utilisateur et des captures d'écran de sites réels, intégrer des résultats de recherche web directement dans une image, et s'appliquer aux photos téléversées par les utilisateurs. OpenAI a aussi introduit une suite de fonctionnalités baptisée "Thinking" pour les abonnés ChatGPT. Ce lancement marque un tournant dans la manière dont OpenAI conçoit la création visuelle. La philosophie revendiquée par l'entreprise est explicite dans ses notes de version : "Les images sont un langage, pas une décoration. Une bonne image fait ce que fait une bonne phrase : elle sélectionne, organise et révèle." En pratique, cela signifie que des professionnels du marketing, de la communication, du journalisme ou de la formation peuvent désormais produire des visuels informationnels complexes sans compétences en design. La capacité à reproduire des figures publiques réelles, comme le PDG Sam Altman, soulève aussi des questions sur l'usage de cet outil à des fins de désinformation, notamment dans le contexte de campagnes d'influence politique utilisant des personnages fictifs présentés comme de "vrais Américains" soutenant Donald Trump, un phénomène récemment documenté par le New York Times. La sortie de ChatGPT Images 2.0 intervient dans un marché de la génération d'images IA de plus en plus disputé. Google avait lancé en février 2026 son propre modèle Nano Banana 2, aussi connu sous le nom Gemini 3 Pro Image, capable lui aussi d'intégrer du texte dense dans les images. Mais selon les premiers tests comparatifs, la solution d'OpenAI surpasse Google sur la fidélité des interfaces et la gestion de compositions multi-images. Face aux risques d'abus, Adele Li, responsable produit ChatGPT Images chez OpenAI, a réaffirmé lors d'un briefing presse l'engagement de l'entreprise en matière de sécurité : les images générées sont taguées avec des métadonnées indiquant leur origine artificielle, et des garde-fous spécifiques visent à prévenir toute interférence électorale. OpenAI insiste sur le fait que ces protections distinguent ChatGPT des nouveaux entrants du secteur, qui opèrent avec "des standards et des philosophies différents".

UELes capacités avancées de reproduction d'interfaces réelles et de personnages publics accroissent les risques de désinformation en Europe, notamment à l'approche d'échéances électorales.

CréationActu
1 source
GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.
2Le Big Data 

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.

OpenAI a déployé discrètement GPT-Image-2 le 21 avril 2026, sans conférence de presse ni annonce officielle de Sam Altman, directement sur les comptes ChatGPT web et mobile de ses utilisateurs dans le monde entier. Ce nouveau moteur de génération d'images représente un saut qualitatif majeur par rapport à son prédécesseur sur trois dimensions précises : le rendu de texte, la gestion de compositions complexes et le photoréalisme. Les premiers tests diffusés sur X montrent des affiches de films avec une typographie parfaitement lisible, des maquettes de Unes du New York Times où chaque colonne et chaque ligne de crédit est nette, et surtout une grille 10x10 contenant 100 objets distincts commençant par la lettre A, chacun correctement nommé et illustré sans aucune erreur de cohérence visuelle ou textuelle. Ces avancées changent concrètement ce que les professionnels peuvent faire avec l'IA générative. Jusqu'ici, intégrer du texte lisible dans une image produite par IA relevait de la loterie : les modèles produisaient systématiquement des caractères déformés, illisibles, mélangés à du pixel noise. Avec GPT-Image-2, cette limite disparaît, ce qui ouvre des usages immédiatement opérationnels pour les designers graphiques, les équipes marketing et les créateurs de contenu : prototypage d'interfaces, création d'affiches, génération de visuels publicitaires avec du texte intégré, le tout en quelques secondes et sans retouche. La gestion de la complexité spatiale, illustrée par la grille 10x10, signifie également que le modèle peut produire des compositions denses et structurées sans perte de cohérence, là où Midjourney et les outils de Google montrent encore des limites significatives dès que la scène se complique. Ce lancement silencieux un mardi s'inscrit dans une stratégie qui n'est pas anodine. Plusieurs observateurs notent que ce type de déploiement discret précède souvent, chez OpenAI, une annonce plus massive dans les jours suivants, des rumeurs évoquent une présentation liée à GPT-5.5 dès jeudi. GPT-Image-2 est par ailleurs le moteur qui alimente déjà l'API Images d'OpenAI depuis quelques semaines, utilisé notamment par des applications tierces comme ChatGPT Canvas et certains outils Canva. Son ouverture progressive au grand public via ChatGPT marque une étape de maturité : le modèle sort du contexte développeur pour entrer dans l'usage quotidien de masse. La concurrence, notamment Midjourney, qui n'a toujours pas de produit web grand public stable, et Adobe Firefly, va devoir répondre à un outil qui combine désormais photoréalisme, précision textuelle et gestion de la complexité dans un seul package accessible à tous.

UELes designers et équipes marketing français et européens peuvent immédiatement intégrer cet outil à leurs workflows pour générer des visuels avec texte lisible intégré, sans retouche manuelle.

💬 Le rendu de texte dans les images IA, c'était le dernier gros problème non résolu. GPT-Image-2 le ferme pour de bon : grille 10x10 sans une seule erreur, affiches avec typo lisible au premier coup d'oeil, c'est le genre de démo qui change ce qu'on peut promettre à un client dès demain matin. Midjourney n'a toujours pas de produit web stable, là ils vont vraiment souffrir.

CréationOpinion
1 source
Deezer : 44 % des nouvelles musiques mises en ligne sont générées par IA, la majorité des écoutes sont frauduleuses
3Ars Technica AI 

Deezer : 44 % des nouvelles musiques mises en ligne sont générées par IA, la majorité des écoutes sont frauduleuses

Deezer a révélé que 44 % des nouvelles musiques téléchargées sur sa plateforme sont générées par intelligence artificielle, soit 75 000 nouvelles pistes IA chaque jour. La société française a développé sa propre technologie de détection des contenus audio synthétiques, qu'elle est l'une des rares plateformes de streaming à déployer activement, et qu'elle commercialise désormais auprès de tiers avec un taux de faux positifs inférieur à 0,01 %. Le constat dépasse la simple prolifération de contenus : la majorité des écoutes de ces titres IA seraient elles-mêmes frauduleuses, générées par des bots et non par de vrais auditeurs. L'ampleur du phénomène soulève des questions directes sur l'économie du streaming musical. Les plateformes reversent des droits aux ayants droit en fonction du nombre d'écoutes ; si ces écoutes sont massivement artificielles, les revenus sont détournés au détriment des artistes humains. Un sondage interne de Deezer illustre la difficulté du problème : lors d'un test où des utilisateurs ont écouté trois morceaux dont deux générés par IA, 97 % d'entre eux n'ont pas été capables d'identifier les titres artificiels. La musique IA peut ainsi circuler dans des playlists sans déclencher la méfiance des auditeurs. Ce phénomène s'inscrit dans une montée en puissance rapide des modèles génératifs audio, Suno, Udio, et d'autres outils permettent désormais de produire des morceaux convaincants en quelques secondes, sans compétences musicales. Contrairement à d'autres secteurs de l'IA qui font régulièrement les manchettes, la musique artificielle s'est développée discrètement, profitant du volume massif de contenus téléchargés sur les plateformes. Spotify et YouTube Music n'ont pas adopté de politique d'étiquetage similaire à celle de Deezer, laissant la question de la transparence largement ouverte. La décision de Deezer de licencier sa technologie de détection pourrait accélérer une prise de conscience sectorielle, mais la course entre génération et détection est loin d'être terminée.

UEDeezer, entreprise française, est en première ligne face à la fraude aux écoutes IA qui détourne les droits versés aux artistes, posant un défi réglementaire direct pour le marché du streaming en Europe.

💬 75 000 pistes IA par jour sur une seule plateforme, c'est pas un problème de niche, c'est une crise silencieuse qui vide les poches des vrais artistes. Ce qui me frappe surtout, c'est la double fraude : du contenu synthétique écouté par des bots, donc de l'argent qui tourne en circuit fermé sans jamais toucher un musicien humain. Deezer a au moins le mérite d'en parler et de vendre sa tech de détection, mais Spotify fait quoi pendant ce temps ?

CréationOpinion
1 source
OpenAI s'attaque à Google avec son nouveau modèle d'image
4The Information AI 

OpenAI s'attaque à Google avec son nouveau modèle d'image

OpenAI prépare discrètement un nouveau modèle de génération d'images, officieusement baptisé "gpt-image-2" par la communauté en ligne. Depuis plusieurs semaines, des images produites par ce modèle circulent sur X et Reddit, repérées par des utilisateurs attentifs qui ont identifié des tests en cours auprès d'une sélection de comptes ChatGPT et sur des plateformes de classement anonymes. Les résultats sont frappants : les images générées atteignent un niveau de photoréalisme tel qu'elles sont, dans certains cas, pratiquement impossibles à distinguer de photographies authentiques. L'enjeu dépasse largement la prouesse technique. OpenAI vise explicitement 1 milliard d'utilisateurs actifs hebdomadaires sur ChatGPT, un seuil symbolique que l'entreprise espérait franchir avant fin 2025. Elle a manqué cet objectif et stagne depuis dans une fourchette autour de 920 millions d'utilisateurs par semaine. Un modèle d'image nettement supérieur aux solutions existantes pourrait constituer le levier capable de débloquer cette croissance, en attirant une nouvelle vague d'utilisateurs grand public, créatifs et professionnels, qui restent encore sur des outils concurrents comme Midjourney ou les offres de Google. La bataille des modèles d'image s'intensifie à mesure que les grands acteurs de l'IA cherchent à consolider leur position. Google, avec Imagen, et les plateformes spécialisées font face à une OpenAI qui cherche à intégrer toujours davantage de capacités directement dans ChatGPT pour en faire un point d'entrée unique. Le lancement officiel de gpt-image-2 n'a pas encore été annoncé, mais la stratégie de tests progressifs suggère une sortie imminente. Si le modèle tient ses promesses de photoréalisme à grande échelle, il pourrait redistribuer significativement les parts de marché dans un secteur où la qualité visuelle est devenue le principal critère de différenciation.

CréationOpinion
1 source