Ideogram 4.0 sort en open-weight avec une…

Ideogram 4.0 affiche des performances record : le nouveau roi des IA d’image open source ?

47

1Le Big Data

Ideogram 4.0 affiche des performances record : le nouveau roi des IA d’image open source ?

Ideogram a lancé le 3 juin 2026 la version 4.0 de son modèle de génération d'images, et les chiffres publiés par la startup canadienne ont rapidement retenu l'attention de la communauté. Sur Design Arena, plateforme de comparaison indépendante basée sur des duels à l'aveugle entre générateurs d'images, Ideogram 4.0 atteint un score Elo de 1285, devançant de plus de 100 points des concurrents directs comme HunyuanImage de Tencent ou Gemini 3 Flash Image Gen de Google. Le modèle repose sur 9,3 milliards de paramètres et introduit une architecture d'entrée originale : les prompts sont fournis sous forme de descriptions JSON structurées plutôt qu'en texte libre, ce qui permet de spécifier des palettes de couleurs précises, des positions d'éléments via coordonnées, et de dissocier le contenu textuel de son style graphique. Disponible dès aujourd'hui sur les plans Ideogram et via API, le modèle est également distribué en poids ouverts sous licence non commerciale, avec une intégration native dans ComfyUI. Ce qui distingue Ideogram 4.0 de ses concurrents n'est pas uniquement la qualité esthétique globale, mais sa maîtrise de la typographie dans les images, l'un des défis les plus persistants de la génération visuelle par IA. Avec un taux de réussite de 47,9 % évalué par des designers professionnels pour la génération de texte lisible et bien intégré, le modèle s'adresse directement aux usages professionnels : création d'affiches, de logos, de visuels marketing ou de contenus éditoriaux. Pour les designers et créateurs de contenu, cette précision change concrètement le flux de travail : il devient possible de produire un visuel complet sans repasser par Photoshop pour corriger une typographie défaillante. Pour les développeurs, les poids ouverts permettent un déploiement local et un fine-tuning sur des données propriétaires, sans dépendance à une API tierce. Ideogram, fondé à Toronto en 2023 par d'anciens chercheurs de Google Brain, s'était déjà imposé comme une référence pour la génération de texte dans les images avec ses versions précédentes, mais restait en retrait face aux modèles fermés de Midjourney ou Adobe Firefly sur la qualité visuelle globale. Ce lancement en open weights s'inscrit dans une tendance plus large où les laboratoires misent sur l'ouverture pour accélérer l'adoption et construire un écosystème de développeurs fidèles, une stratégie que Meta a popularisée avec LLaMA dans le domaine du texte. La vraie question reste la durabilité de l'avance d'Ideogram : Stability AI, Black Forest Labs (auteur de FLUX) et les équipes de Tencent travaillent sur des modèles comparables, et les benchmarks Elo peuvent évoluer vite. Les prochains mois diront si Ideogram 4.0 s'impose comme standard ou si la course reste ouverte.

UELes poids ouverts sous licence non commerciale permettent aux développeurs et chercheurs européens de déployer le modèle localement sans dépendance à une API tierce, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.

💬 La typo dans les images, c'était le vrai problème depuis le début. 47,9% de réussite sur du texte lisible évalué par des designers pros, ça change la donne en production, et le format JSON pour spécifier palette et positions rend le truc plus prévisible qu'un prompt texte classique. Les poids ouverts non commerciaux, c'est un bon signal, mais faut pas oublier que FLUX et les équipes Tencent ne dorment pas.

CréationOpinion

1 source

Génération d'images IA d'entreprise en 2 secondes : Krea 2 Raw et Turbo en open weights sous licence personnalisée

48

2VentureBeat AI

Génération d'images IA d'entreprise en 2 secondes : Krea 2 Raw et Turbo en open weights sous licence personnalisée

La startup américaine Krea vient d'ouvrir les poids de son nouveau modèle de génération d'images Krea 2, disponible en deux variantes sur Hugging Face : « Krea 2 Raw », orienté qualité maximale, et « Krea 2 Turbo », capable de produire une image en seulement 2 secondes. Le modèle est publié sous une licence personnalisée qui impose des conditions précises : les entreprises de plus de 50 utilisateurs doivent souscrire à une offre Enterprise payante, et tous les utilisateurs, quelle que soit leur taille, sont tenus de mettre en place des garde-fous techniques pour empêcher la génération de contenus illégaux, d'images intimes non consenties (NCII), de matériel pédopornographique (CSAM) ou de contenus diffamatoires. Au-delà de la vitesse, Krea met en avant une variété visuelle supérieure aux générateurs habituels, une meilleure fidélité aux prompts, et des capacités de personnalisation étendues, notamment la compatibilité avec les LoRA et les références de style. L'enjeu est de taille pour les entreprises qui intègrent déjà la génération d'images dans leurs workflows de production. Une critique récurrente dans l'industrie pointe la monotonie esthétique de l'imagerie IA, ce que les anglophones appellent désormais l'« AI slop » : des visuels interchangeables, sans personnalité, incapables de différencier une marque de ses concurrentes. Krea tente de répondre directement à ce problème en offrant un modèle ouvert qui permet aux équipes techniques d'affiner les sorties selon leur identité visuelle. La vitesse de Krea 2 Turbo le positionne également comme un outil viable pour les pipelines à fort débit : à 2 secondes par image, il devance des références comme Midjourney v8.1 en mode Turbo (3 à 6 secondes) ou FLUX.2 [klein] de Black Forest Labs (3,9 à 4,6 secondes selon la variante), et ne se retrouve dépassé que par des modèles très optimisés comme FLUX.1 [schnell] de Prodia (0,5 seconde) ou Z-Image Turbo sur Replicate et fal.ai (1,8 seconde). Ce lancement s'inscrit dans une dynamique plus large de démocratisation des modèles de génération d'images, où les acteurs open source cherchent à concurrencer directement des plateformes propriétaires comme Midjourney ou les solutions cloud de Microsoft (MAI Image 2 via Azure) et Google. En adoptant un modèle hybride, poids ouverts pour les petits utilisateurs, licence commerciale pour les grandes organisations, Krea suit une stratégie similaire à celle de Black Forest Labs avec la famille FLUX, tentant de capter simultanément la communauté des développeurs et les budgets des entreprises. La contrainte de safeguards techniques imposée à tous les utilisateurs reflète aussi une pression réglementaire croissante, notamment en Europe, sur la responsabilité des fournisseurs d'outils génératifs face aux contenus préjudiciables.

UELa licence imposant des garde-fous techniques contre les contenus illégaux s'aligne avec les obligations de l'AI Act européen, facilitant l'adoption de ce modèle ouvert dans les workflows d'entreprises soumises à la réglementation européenne.

CréationOpinion

1 source

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga

49

3VentureBeat AI

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga

OpenAI a officiellement lancé ChatGPT Images 2.0 ce mois d'avril 2026, quelques mois seulement après la sortie de GPT-Image-1.5 en décembre 2025. Le nouveau modèle, baptisé en interne "duct tape" lors de semaines de tests discrets sur la plateforme LM Arena AI, est désormais accessible à tous les abonnés ChatGPT, tous niveaux confondus. Pour les développeurs, il est disponible via l'API sous le nom gpt-image-2. Ses capacités dépassent largement celles de son prédécesseur : génération de longs blocs de texte multilingues intégrés dans une image, création d'infographies complètes, de diapositives, de cartes, de mangas, de plans d'appartement, de grilles d'images multiples et de modèles de personnages sous différents angles. Le modèle peut également reproduire avec une fidélité troublante des interfaces utilisateur et des captures d'écran de sites réels, intégrer des résultats de recherche web directement dans une image, et s'appliquer aux photos téléversées par les utilisateurs. OpenAI a aussi introduit une suite de fonctionnalités baptisée "Thinking" pour les abonnés ChatGPT. Ce lancement marque un tournant dans la manière dont OpenAI conçoit la création visuelle. La philosophie revendiquée par l'entreprise est explicite dans ses notes de version : "Les images sont un langage, pas une décoration. Une bonne image fait ce que fait une bonne phrase : elle sélectionne, organise et révèle." En pratique, cela signifie que des professionnels du marketing, de la communication, du journalisme ou de la formation peuvent désormais produire des visuels informationnels complexes sans compétences en design. La capacité à reproduire des figures publiques réelles, comme le PDG Sam Altman, soulève aussi des questions sur l'usage de cet outil à des fins de désinformation, notamment dans le contexte de campagnes d'influence politique utilisant des personnages fictifs présentés comme de "vrais Américains" soutenant Donald Trump, un phénomène récemment documenté par le New York Times. La sortie de ChatGPT Images 2.0 intervient dans un marché de la génération d'images IA de plus en plus disputé. Google avait lancé en février 2026 son propre modèle Nano Banana 2, aussi connu sous le nom Gemini 3 Pro Image, capable lui aussi d'intégrer du texte dense dans les images. Mais selon les premiers tests comparatifs, la solution d'OpenAI surpasse Google sur la fidélité des interfaces et la gestion de compositions multi-images. Face aux risques d'abus, Adele Li, responsable produit ChatGPT Images chez OpenAI, a réaffirmé lors d'un briefing presse l'engagement de l'entreprise en matière de sécurité : les images générées sont taguées avec des métadonnées indiquant leur origine artificielle, et des garde-fous spécifiques visent à prévenir toute interférence électorale. OpenAI insiste sur le fait que ces protections distinguent ChatGPT des nouveaux entrants du secteur, qui opèrent avec "des standards et des philosophies différents".

UELes capacités avancées de reproduction d'interfaces réelles et de personnages publics accroissent les risques de désinformation en Europe, notamment à l'approche d'échéances électorales.

CréationActu

1 source

40

4Le Big Data

Change Weight par Artspace, change ton physique en un swipe ! - avril 2026

Artspace a dévoilé en avril 2026 une nouvelle fonctionnalité baptisée Change Weight, qui permet de modifier la morphologie d'un personnage dans une image générée ou importée, en quelques secondes et sans reprise manuelle. L'outil repose sur un algorithme capable d'identifier la structure osseuse et les tissus du sujet, puis de redistribuer les volumes de façon anatomiquement cohérente. Un simple curseur suffit à alléger ou épaissir une silhouette : l'IA recalcule dans la foulée les textures des vêtements, les plis du tissu, les ombres portées sur la peau et les interactions avec l'arrière-plan. Le résultat, obtenu en une trentaine de secondes selon la plateforme, préserve l'identité faciale du personnage, ce que peu de générateurs concurrents parviennent à garantir. La fonctionnalité s'inscrit dans l'offre Artspace, plateforme de création visuelle par IA qui se positionne face à des acteurs comme Midjourney. L'intérêt de Change Weight dépasse la démonstration technique. Pour un illustrateur, la possibilité de faire varier la corpulence d'un même protagoniste sans recommencer la génération représente un gain de temps substantiel dans des productions souvent contraintes. Pour les équipes marketing, cela signifie pouvoir tester différentes représentations d'un même personnage sans multiplier les séances photo ou les itérations de prompts. La démocratisation de ce niveau de retouche est réelle : ce type de manipulation précise relevait jusqu'ici de logiciels professionnels complexes, coûteux, et réservés aux studios spécialisés. Artspace le rend accessible dans une interface grand public, ce qui abaisse considérablement la barrière d'entrée pour les créateurs indépendants et les agences de taille modeste. Cette annonce s'inscrit dans une tendance de fond qui traverse l'industrie de l'image par IA : après la course à la génération brute, les acteurs du secteur pivotent vers le contrôle fin et la manipulation ciblée. Générer une image depuis un prompt ne suffit plus aux professionnels, qui réclament des outils permettant d'intervenir sur des éléments précis, pose, expression, silhouette, sans altérer le reste de la composition. Artspace, comme d'autres plateformes concurrentes, mise sur cette granularité pour se différencier. La question qui se pose en parallèle est celle des usages sensibles : un outil capable de modifier le corps d'un individu avec un réalisme convaincant alimente logiquement des débats sur les représentations corporelles et les dérives potentielles, un sujet que ni Artspace ni l'article source n'abordent, mais que l'industrie devra inévitablement affronter à mesure que ces fonctionnalités se généralisent.

CréationOutil

1 source

Ideogram 4.0 sort en open-weight avec une résolution native 2K et un rendu de texte amélioré

À lire aussi

Ideogram 4.0 affiche des performances record : le nouveau roi des IA d’image open source ?

Génération d'images IA d'entreprise en 2 secondes : Krea 2 Raw et Turbo en open weights sous licence personnalisée

ChatGPT Images 2.0 d'OpenAI gère le texte multilingue, les infographies, les diapositives, les cartes et le manga

Change Weight par Artspace, change ton physique en un swipe ! - avril 2026