Aller au contenu principal
ChatGPT Images 2.0 : comment transformer vos photos en dessins MS Paint ?
CréationLe Big Data2sem

ChatGPT Images 2.0 : comment transformer vos photos en dessins MS Paint ?

Résumé IASource uniqueImpact UE
Source originale ↗·

Depuis le 30 avril 2026, un prompt pour ChatGPT Images 2.0 circule à vitesse fulgurante sur les réseaux sociaux. Partagé par l'utilisateur @arrakis_ai sur X, il demande à l'IA de redessiner n'importe quelle photo de la manière la plus maladroite possible, comme si le résultat avait été tracé à la souris dans Microsoft Paint : traits brouillons, proportions bancales, rendu pixelisé à l'extrême. L'image doit rester vaguement reconnaissable tout en provoquant un effet comique immédiat. La chute du prompt joue aussi un rôle décisif : après toutes ces instructions précises, une phrase désinvolte coupe court à la logique et donne à l'IA une liberté totale, ce qui produit des visuels imprévisibles et souvent absurdes. En quelques heures, des milliers d'utilisateurs ont reproduit l'expérience et inondé leurs fils d'images volontairement ratées.

Le paradoxe est frappant : ChatGPT Images 2.0, présenté comme un outil de génération d'images haute fidélité capable de produire des visuels quasi photoréalistes, cartonne précisément quand on lui demande de faire le contraire. Ce phénomène révèle une vraie fatigue face à la surproduction d'images lisses et calibrées qui envahissent les plateformes depuis l'essor des IA génératives. Les dessins maladroits accrochent là où les rendus parfaits glissent, parce qu'ils surprennent, font sourire et cassent les codes esthétiques dominants. Pour les créateurs de contenu et les marques, la leçon est contre-intuitive mais réelle : l'irrégularité et l'imperfection ont une valeur virale que la perfection technique ne garantit pas. Le rendu bancal devient un langage visuel à part entière, accessible à tous sans compétence artistique préalable.

Cette tendance s'inscrit dans un contexte plus large de maturité du grand public face aux IA génératives. Après une première phase d'émerveillement devant le réalisme des images produites, les utilisateurs cherchent désormais à détourner ces outils plutôt qu'à les utiliser à leur plein potentiel technique. ChatGPT Images 2.0, lancé par OpenAI en 2025 avec des capacités de génération et d'édition nettement améliorées, se retrouve ainsi mobilisé pour des usages humoristiques et participatifs qui n'étaient pas au coeur de sa conception. Cette dynamique rappelle des précédents comme les filtres déformants de FaceApp ou les memes générés par DALL-E : les plateformes d'IA les plus puissantes trouvent souvent leur premier vrai moment culturel non pas dans leurs exploits techniques, mais dans leurs détournements les plus absurdes. La question reste ouverte de savoir si OpenAI capitalisera sur cette viralité ou si le phénomène restera une parenthèse éphémère dans le cycle des tendances internet.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

ChatGPT Images 2.0 : points verts, artefacts… comment résoudre les bugs ?
1Le Big Data 

ChatGPT Images 2.0 : points verts, artefacts… comment résoudre les bugs ?

Depuis la mise à jour de son module de génération d'images baptisé ChatGPT Images 2.0, OpenAI fait face à une vague de signalements de la part de ses utilisateurs : le modèle produit régulièrement des rendus visuellement corrompus. Les deux manifestations les plus fréquentes sont un bruit fractal envahissant, points verts, damiers hallucinatoires, micro-motifs répétitifs dans les zones complexes comme les feuillages ou les nuages, et un effet dit de "ghosting", où les contours d'une image générée précédemment dans la même conversation se superposent à la nouvelle création. Ainsi, un utilisateur qui demande successivement un vaisseau spatial puis une grenouille peut se retrouver avec les géométries du premier incrustées sur le visage du second. Ces bugs se manifestent surtout lorsqu'une image de référence est fournie, que le style demandé est précis (peinture numérique, rendu photoréaliste), ou que le prompt est particulièrement dense en détails. L'impact est concret pour tous ceux qui utilisent ChatGPT comme outil de production visuelle : créatifs freelance, équipes marketing, illustrateurs ou développeurs intégrant la génération d'images dans leurs workflows. Une mise à jour censée enrichir les capacités créatives du modèle introduit en pratique une instabilité qui force des régénérations répétées, dégrade la fiabilité du service et soulève des questions sur le contrôle qualité d'OpenAI lors des déploiements. La frustration est d'autant plus grande que ChatGPT Images 2.0 apportait par ailleurs de réelles améliorations en termes de cohérence et de détail. OpenAI n'a fourni aucune documentation officielle sur ces défaillances, mais la communauté technique a formulé trois hypothèses sur les causes profondes. La première pointe vers l'algorithme de filigrane invisible intégré aux images générées par IA à des fins d'authentification : dans les compositions complexes, cette grille de marquage ressortirait de manière visible. La deuxième tient au fonctionnement autorégressif du nouveau modèle, qui conserverait en mémoire l'ensemble des images générées dans une conversation et ne parviendrait plus à isoler ce qui doit être oublié entre deux requêtes. La troisième invoque un mécanisme d'upscaling défaillant : confronté à un prompt trop ambitieux, le modèle entrerait dans une boucle en reproduisant indéfiniment le même micro-motif pour remplir l'espace. En attendant un correctif officiel, la solution la plus efficace identifiée par les utilisateurs reste radicalement simple : démarrer une nouvelle conversation pour chaque image, afin d'effacer le contexte visuel accumulé.

UELes créatifs freelance, équipes marketing et développeurs français et européens intégrant la génération d'images IA dans leurs workflows de production subissent une dégradation de fiabilité qui force des régénérations répétées et ralentit leur productivité.

CréationOutil
1 source
ChatGPT Images 2.0 : Ils ont enfin corrigé CE défaut qui rendait tout le monde fou !
2Le Big Data 

ChatGPT Images 2.0 : Ils ont enfin corrigé CE défaut qui rendait tout le monde fou !

OpenAI a officiellement lancé ChatGPT Images 2.0 le 21 avril 2026, une refonte majeure de son générateur d'images propulsée par un nouveau modèle baptisé gpt-image-2. La mise à jour est immédiatement disponible pour les abonnés ChatGPT Plus, Pro et Business, avec un déploiement Enterprise annoncé prochainement. Le modèle est également accessible via l'API OpenAI, permettant aux développeurs de l'intégrer dans leurs propres services. Sur mobile, une mise à jour de l'application est requise pour profiter de l'ensemble des fonctionnalités. Parmi les changements les plus visibles : la génération de variations multiples en une seule requête, la prise en charge de formats allant du 3:1 au 1:3, et une capacité inédite à analyser des demandes complexes avant de générer quoi que ce soit, en s'appuyant parfois sur des recherches web pour affiner le résultat. La principale avancée concerne le rendu du texte dans les images, longtemps considéré comme le talon d'Achille de l'outil. Là où les versions précédentes déformaient systématiquement les mots et produisaient des caractères illisibles, gpt-image-2 peut désormais afficher des phrases entières, voire des paragraphes, de manière cohérente et intégrée visuellement. Cette capacité s'étend à plusieurs langues au-delà de l'anglais, ce qui élargit considérablement son utilité pour les créateurs de contenu à l'international. Pour les professionnels du marketing, de la communication ou du design qui avaient abandonné ChatGPT pour Midjourney ou Adobe Firefly sur ce point précis, cette correction représente un changement concret d'usage. Le modèle gagne également en fidélité d'exécution : il respecte mieux les consignes détaillées, reproduit avec plus de cohérence les styles demandés (photo réaliste, cinématique, pixel art, manga) et restitue les petits éléments qui échappaient souvent aux générations précédentes. Cette mise à jour s'inscrit dans une course à l'amélioration des générateurs d'images multimodaux où OpenAI accusait un certain retard face à des concurrents comme Midjourney v6 ou Stable Diffusion 3. Depuis l'intégration de DALL-E dans ChatGPT, le principal frein à l'adoption massive restait précisément la gestion du texte dans les visuels, un problème structurel lié à la manière dont les modèles de diffusion encodent les caractères. Le passage à gpt-image-2 semble marquer une rupture architecturale sur ce point. OpenAI continue néanmoins de signaler des limites : les mises en page complexes peuvent encore produire des résultats imparfaits, et le rendu multilingue n'est pas encore irréprochable. Les prochains mois diront si cette version consolide la position de ChatGPT comme outil généraliste de création visuelle ou si elle reste distancée par des solutions spécialisées.

UELes créateurs de contenu et professionnels du marketing en France et en Europe peuvent utiliser gpt-image-2 pour générer des visuels avec texte lisible en plusieurs langues via ChatGPT ou l'API OpenAI, élargissant concrètement son utilité pour la production francophone.

CréationOpinion
1 source
Tencent HY-World 2.0 : cette IA transforme vos mots en jeux vidéo… et c’est open source !
3Le Big Data 

Tencent HY-World 2.0 : cette IA transforme vos mots en jeux vidéo… et c’est open source !

Tencent a publié le 16 avril 2026 HY-World 2.0, un modèle d'intelligence artificielle open source capable de générer des environnements 3D interactifs complets à partir d'un simple texte, d'une image ou d'une vidéo. Le processus prend environ 712 secondes, soit moins de douze minutes, en exploitant des GPU NVIDIA H20. Le modèle repose sur une chaîne de quatre modules spécialisés : HY-Pano 2.0 convertit le point de départ en panorama sphérique à 360 degrés, WorldNav planifie jusqu'à 35 trajectoires de caméra pour explorer l'espace sans collision, WorldStereo 2.0 génère de nouvelles vues pour combler les angles morts, et WorldMirror 2.0 reconstruit la scène finale en 3D Gaussian Splatting. L'algorithme MaskGaussian réduit le volume des données de 73,7 % en éliminant les points superflus, sans dégrader la qualité visuelle, maintenant un PSNR de 25.017. Les scènes exportées sont directement compatibles avec Unity et Unreal Engine, et incluent la détection de collisions pour la robotique. Tencent publie les poids, le code et le rapport technique en accès libre. Cette publication change concrètement l'accès à la génération de mondes 3D, jusqu'ici réservée à des équipes disposant de ressources considérables. Un développeur de jeu indépendant, un studio de simulation ou une équipe de robotique peut désormais produire un environnement 3D explorable en moins d'un quart d'heure, sans pipeline propriétaire ni licence coûteuse. Le fait que les exports soient nativement compatibles avec les deux moteurs de jeu dominants du marché supprime une étape d'intégration habituellement chronophage. Pour la robotique incarnée, la possibilité de générer des environnements de simulation physiquement cohérents à la demande ouvre des perspectives importantes pour l'entraînement d'agents autonomes à moindre coût. HY-World 2.0 arrive dans un contexte de compétition intense autour des "world models", ces systèmes capables de simuler des environnements physiquement plausibles. Google DeepMind a présenté Genie 3, qui adopte une approche par génération vidéo, tandis que World Labs de Fei-Fei Li a lancé Marble, solution entièrement fermée. Tencent choisit délibérément l'open source pour s'imposer comme référence de la recherche et attirer la communauté des développeurs, une stratégie déjà utilisée avec la série Hunyuan sur la génération d'images et de vidéos. L'enjeu dépasse le jeu vidéo : les world models sont considérés comme une brique fondamentale pour entraîner des robots et des agents IA capables d'agir dans le monde réel. En rendant HY-World 2.0 librement accessible, Tencent accélère la diffusion de cette technologie et complique la position des acteurs qui misaient sur la fermeture de leurs systèmes comme avantage concurrentiel.

UELes studios indépendants et équipes de robotique français et européens peuvent désormais générer des environnements 3D professionnels gratuitement, réduisant leur dépendance aux solutions propriétaires coûteuses.

💬 12 minutes pour un monde 3D explorable, exportable direct dans Unity ou Unreal, open source. Ce qui est intéressant ici, c'est pas la performance technique (solide, mais la concurrence existe), c'est que Tencent lâche tout en public pile au moment où World Labs joue la carte du fermé, le même coup qu'avec Hunyuan. Un studio indé peut démarrer avec ça demain, sans débourser un centime.

CréationOpinion
1 source
ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga
4VentureBeat AI 

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga

OpenAI a officiellement lancé ChatGPT Images 2.0 ce mois d'avril 2026, quelques mois seulement après la sortie de GPT-Image-1.5 en décembre 2025. Le nouveau modèle, baptisé en interne "duct tape" lors de semaines de tests discrets sur la plateforme LM Arena AI, est désormais accessible à tous les abonnés ChatGPT, tous niveaux confondus. Pour les développeurs, il est disponible via l'API sous le nom gpt-image-2. Ses capacités dépassent largement celles de son prédécesseur : génération de longs blocs de texte multilingues intégrés dans une image, création d'infographies complètes, de diapositives, de cartes, de mangas, de plans d'appartement, de grilles d'images multiples et de modèles de personnages sous différents angles. Le modèle peut également reproduire avec une fidélité troublante des interfaces utilisateur et des captures d'écran de sites réels, intégrer des résultats de recherche web directement dans une image, et s'appliquer aux photos téléversées par les utilisateurs. OpenAI a aussi introduit une suite de fonctionnalités baptisée "Thinking" pour les abonnés ChatGPT. Ce lancement marque un tournant dans la manière dont OpenAI conçoit la création visuelle. La philosophie revendiquée par l'entreprise est explicite dans ses notes de version : "Les images sont un langage, pas une décoration. Une bonne image fait ce que fait une bonne phrase : elle sélectionne, organise et révèle." En pratique, cela signifie que des professionnels du marketing, de la communication, du journalisme ou de la formation peuvent désormais produire des visuels informationnels complexes sans compétences en design. La capacité à reproduire des figures publiques réelles, comme le PDG Sam Altman, soulève aussi des questions sur l'usage de cet outil à des fins de désinformation, notamment dans le contexte de campagnes d'influence politique utilisant des personnages fictifs présentés comme de "vrais Américains" soutenant Donald Trump, un phénomène récemment documenté par le New York Times. La sortie de ChatGPT Images 2.0 intervient dans un marché de la génération d'images IA de plus en plus disputé. Google avait lancé en février 2026 son propre modèle Nano Banana 2, aussi connu sous le nom Gemini 3 Pro Image, capable lui aussi d'intégrer du texte dense dans les images. Mais selon les premiers tests comparatifs, la solution d'OpenAI surpasse Google sur la fidélité des interfaces et la gestion de compositions multi-images. Face aux risques d'abus, Adele Li, responsable produit ChatGPT Images chez OpenAI, a réaffirmé lors d'un briefing presse l'engagement de l'entreprise en matière de sécurité : les images générées sont taguées avec des métadonnées indiquant leur origine artificielle, et des garde-fous spécifiques visent à prévenir toute interférence électorale. OpenAI insiste sur le fait que ces protections distinguent ChatGPT des nouveaux entrants du secteur, qui opèrent avec "des standards et des philosophies différents".

UELes capacités avancées de reproduction d'interfaces réelles et de personnages publics accroissent les risques de désinformation en Europe, notamment à l'approche d'échéances électorales.

CréationActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour