ÉthiqueNext INpact · 4 juin 2026, 12:54· 2 min de lecture

Booster les sondages avec l’IA générative, une (fausse) bonne idée ?

Résumé IASource uniqueImpact UE Take éditorial

En 2024, l'Ifop a publié un sondage sur l'intention de vote des enseignants aux élections européennes en s'associant avec la start-up française Fairgen, spécialisée dans la donnée synthétique. Le sondage affichait un échantillon de 8 000 personnes et 580 enseignants de collège et lycée, mais en réalité, seuls 116 enseignants avaient été interrogés. Les 464 réponses restantes avaient été générées artificiellement via la technologie "DataBoostAI" de Fairgen, décrite comme une IA générative permettant "la mise en relation holistique des données recueillies" pour produire des "échantillons synthétiques". L'information figurait dans la notice méthodologique, mais l'Ifop n'avait pas jugé utile de mentionner explicitement l'usage de l'IA générative dans ses avertissements habituels. Interrogé par Next, l'Ifop n'a pas répondu. Fairgen se présente toujours comme "pionniers de la donnée synthétique" et revendique un partenariat avec l'Ifop "depuis 2023".

L'enjeu est considérable pour l'industrie du sondage : si l'IA générative permettait de multiplier virtuellement les réponses à partir d'un petit échantillon réel, les coûts d'enquête s'effondreraient et les délais de production aussi. Les instituts pourraient théoriquement sonder des sous-populations très ciblées, les enseignants, les artisans, les jeunes ruraux, sans avoir à recruter des centaines de profils rares et coûteux. Mais les statisticiens Arthur Charpentier et Guillaume Chauvet pointent le risque fondamental : les données synthétiques reproduisent les biais et corrélations du jeu d'entraînement. Interroger 116 personnes puis en "générer" 464 autres ne produit pas de nouveaux faits, cela amplifie les patterns existants, avec une illusion de précision statistique. La transparence vis-à-vis du public et des régulateurs reste aussi entière : comment évaluer la fiabilité d'un sondage électoral si les réponses ont été en partie fabriquées ?

La question va bien au-delà de l'Ifop. Tous les grands instituts lorgent sur ces techniques, mais peu ont franchi le pas publiquement. Chez Ipsos/BVA, le directeur d'études Mathieu Gallard assure que les sondages d'opinion politique et électorale n'utilisent pas encore ces méthodes, tout en reconnaissant que des tests sont en cours, notamment sur des applications marketing ou dans d'autres pays. L'élection présidentielle française de 2027 pourrait devenir un terrain d'expérimentation grandeur nature pour ces technologies, dans un contexte où la défiance envers les sondages est déjà élevée. Si la tentation économique est réelle, le risque de voir des résultats électoraux influencés par des données partiellement synthétiques, sans que le grand public en soit clairement informé, pose une question de fond sur la légitimité démocratique de ces outils.

Impact France/UE

L'usage de données synthétiques par l'Ifop pour des sondages électoraux, et la possible généralisation de ces pratiques avant la présidentielle française de 2027, interpelle directement le cadre légal français sur la transparence des sondages d'opinion.

💬 L'analyse de Mathieu

116 personnes interrogées, 464 inventées, et l'Ifop appelle ça un sondage de 8 000 individus. Le problème, c'est pas l'IA en soi, c'est qu'on habille une économie de moyens avec un vernis de précision statistique. Avec 2027 en ligne de mire, si les instituts s'y mettent sans règles claires, on va avoir des intentions de vote basées sur des patterns amplifiés, pas sur ce que les gens pensent vraiment.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Next INpact

L’intégration des IA génératives dans les réseaux sociaux influence l’opinion

Des chercheurs, dont les travaux ont été publiés sur la plateforme de prépublication arXiv et acceptés à la conférence ICML 2026 selon un communiqué de l'université d'Oxford, montrent que les suggestions de reformulation proposées par les IA génératives sur les réseaux sociaux peuvent biaiser durablement les débats collectifs. LinkedIn propose depuis 2024 une fonction permettant de reformuler ses publications via un grand modèle de langage avant publication, tandis que Grok, l'IA intégrée à X, propose d'ajouter du contexte à des messages publiés par d'autres utilisateurs. Pour mesurer l'ampleur du phénomène, l'équipe a d'abord testé plusieurs modèles de langage ouverts en leur demandant de rédiger et d'améliorer des publications portant sur 13 sujets politiques, à partir d'arguments originaux et de textes rédigés par des humains : tous les modèles ont introduit des biais, parfois différents de ceux exprimés lors d'une simple conversation avec le même modèle, comme sur le thème de l'athéisme. Les chercheurs ont ensuite appliqué un modèle mathématique de dynamique d'opinion établi en 1990 pour simuler l'effet de ces biais à l'échelle d'un réseau social entier. En rejouant, avec le modèle gemma-3-12b-it de Google, des données issues de Twitter, Facebook et Google+ datant de 2012 sur le thème de l'avortement, la simulation montre qu'une population initialement anti-avortement peut basculer vers une opinion majoritairement pro-choix dès que les suggestions de reformulation générées par IA entrent en jeu. Ce résultat concerne directement des centaines de millions d'utilisateurs de plateformes proposant déjà ce type d'assistance à l'écriture. Un biais individuellement minime, presque imperceptible pour l'utilisateur qui accepte une suggestion parce qu'elle lui semble « plus convaincante », peut se propager et s'amplifier via les mécanismes d'influence interpersonnelle propres aux réseaux sociaux, jusqu'à faire basculer une opinion collective sur des sujets aussi sensibles que l'avortement, l'éducation ou la religion. Contrairement à une manipulation frontale, cette influence agit sans que l'utilisateur en ait conscience : il continue de croire qu'il exprime son propre point de vue, alors que le choix des mots, effectué par le modèle de la plateforme, a orienté le sens du message. Pour LinkedIn comme pour X, cela pose la question de la transparence de ces outils, en particulier à l'approche d'échéances électorales où la formation de l'opinion publique est un enjeu majeur. Les biais des grands modèles de langage sont documentés depuis plusieurs années, mais cette étude est l'une des premières à modéliser mathématiquement leur propagation à l'échelle d'un réseau social plutôt que d'une seule conversation. Les chercheurs se sont notamment penchés sur la fonction « explique ce message » de Grok sur X, qui ajoute du contexte à une publication sans jamais réécrire le texte de son auteur, une caractéristique qui la rend, selon eux, particulièrement difficile à détecter. L'enjeu dépasse les deux plateformes étudiées : à mesure que les fonctions d'aide à l'écriture par IA se généralisent sur les messageries professionnelles et les outils de productivité, la neutralité politique et culturelle de ces systèmes devient centrale pour les régulateurs et les entreprises qui les déploient. Les auteurs appellent à davantage de transparence sur ces biais et à des audits réguliers, avant que ces outils ne deviennent un vecteur d'influence à l'échelle de millions de conversations quotidiennes.

UELes fonctions de reformulation par IA de plateformes tres utilisees en France et en Europe (LinkedIn, X) pourraient orienter subtilement l'opinion publique lors de debats sensibles ou d'echeances electorales, posant un enjeu de transparence pour les regulateurs europeens.

ÉthiquePaper

1 source

2Next INpact

Amnesty appelle à interdire les IA génératives entraînées sur du pillage de données

Amnesty International a publié un rapport détaillé sur les violations des droits humains causées par l'intelligence artificielle générative, appelant explicitement à interdire les modèles entraînés sur du scraping de données non consenti. L'organisation analyse l'ensemble de la chaîne de production de l'IA, des fabricants de puces GPU jusqu'aux contenus générés, en passant par la constitution des jeux de données. Elle cible directement les outils grand public les plus utilisés : ChatGPT, DALL-E, Gemini, Midjourney, LLaMA, Stable Diffusion et DeepSeek. Selon Amnesty, ces modèles ont été construits à partir de données collectées "sans la connaissance ni le consentement des personnes à l'origine des données", qu'il s'agisse d'utilisateurs de réseaux sociaux ou d'artistes. La conclusion est sans appel : le scraping massif et non consenti est "fondamentalement incompatible avec le droit international relatif aux droits humains", notamment le Pacte international relatif aux droits civils et politiques adopté par l'ONU en 1966. L'impact dépasse la seule question de la vie privée. Amnesty identifie des violations du droit à la non-discrimination, à la liberté d'expression et à la liberté de pensée. Le rapport pointe également les coûts environnementaux de l'IA générative, dont l'augmentation continue de la taille des modèles et des volumes de données nécessaires à leur entraînement affecte de manière disproportionnée les pays du Sud global. À cela s'ajoute une domination culturelle et linguistique anglophone structurelle, intégrée dès la phase de collecte des données. Pour l'ONG, derrière l'apparence de sophistication technologique se cache "une réalité faite de principes de conception qui bafouent les droits humains", comparables aux dérives des outils d'IA antérieurs à la générative. Ce rapport s'inscrit dans un mouvement plus large de contestation juridique et institutionnelle du modèle économique des grandes plateformes d'IA. En Europe, l'organisation noyb a déjà menacé Meta d'une class action pour l'entraînement de ses modèles sur des données d'utilisateurs européens, et plusieurs artistes ainsi que des éditeurs de presse ont engagé des procédures similaires aux États-Unis contre OpenAI et Google. Le règlement européen sur l'IA impose des obligations de transparence sur les données d'entraînement, mais les ONG estiment ces mesures insuffisantes. En demandant une interdiction pure et simple des systèmes bâtis sur du scraping non consenti, Amnesty franchit un cap rhétorique notable : il ne s'agit plus de réguler ces pratiques, mais de les proscrire au nom du droit international, ce qui pourrait alimenter de nouvelles stratégies judiciaires et législatives dans les mois à venir.

UEL'AI Act impose déjà des obligations de transparence sur les données d'entraînement, et noyb menace Meta d'une class action pour l'exploitation des données d'utilisateurs européens, la position d'Amnesty pourrait renforcer ces procédures et peser sur les stratégies législatives et judiciaires dans l'UE dans les mois à venir.

💬 La position d'Amnesty est radicale, et c'est exactement là son intérêt : plus de régulation molle, on interdit ce qui viole les droits humains, point. Interdire ChatGPT et Gemini du jour au lendemain c'est pas pour demain, mais ancrer ce débat dans le droit international plutôt que dans la soft law de l'AI Act, c'est un changement de registre qui peut nourrir des procédures vraiment musclées. Reste à voir si les juges suivront.

ÉthiqueReglementation

1 source

3The Verge AI

Le culte de l'IA générative a un goût d'eugénisme

La réalisatrice Valerie Veatch a exploré Sora, le modèle texte-vers-vidéo d'OpenAI lancé en 2024, attirée par les communautés d'artistes qui se formaient autour de l'IA générative. Elle a rapidement été choquée par la fréquence avec laquelle la technologie produisait des contenus racistes et sexistes. Ce qui l'a encore plus troublée : l'indifférence de ses pairs enthousiastes face à ces dérives, qu'elle associe à une forme d'eugénisme numérique.

UELe règlement européen sur l'IA (AI Act) impose des exigences strictes contre les biais discriminatoires dans les systèmes d'IA, rendant ce type de dérive directement pertinent pour les acteurs déployant des outils génératifs en Europe.

ÉthiqueOpinion

1 source

4Next INpact

Images et vidéos pédocriminelles crédibles générées par IA se multiplient, alerte l’IWF

L'Internet Watch Foundation (IWF), organisation britannique indépendante spécialisée dans la lutte contre les contenus pédocriminels en ligne, tire la sonnette d'alarme dans un rapport publié en 2025 : les images et vidéos d'agressions sexuelles sur mineurs générées par intelligence artificielle sont devenues « routinières ». En juillet 2024, ses analystes repéraient encore les premières vidéos entièrement produites par IA — facilement identifiables à leurs défauts techniques. Un an plus tard, l'organisation a recensé plus de 8 000 images et près de 3 500 vidéos crédibles de ce type, contre seulement 13 vidéos l'année précédente. Plus alarmant encore, 65 % de ces vidéos appartiennent à la « catégorie A », réservée aux contenus les plus extrêmes — une proportion supérieure aux 43 % observés pour les contenus criminels non générés par IA traités sur la même période. Ces contenus ne sont pas moins dangereux parce qu'ils sont artificiels. Selon l'IWF, ils renforcent l'attrait sexuel pour les enfants, contribuent à normaliser des actes d'une violence extrême et peuvent accroître le risque de passages à l'acte. S'y ajoute une double victimisation : les modèles génératifs sont entraînés sur des images d'agressions réelles, ce qui signifie que l'image de survivants est réutilisée, modifiée et parfois « augmentée » pour produire de nouveaux contenus. Cette réexploitation démultiplie le traumatisme des victimes initiales. Le phénomène présente également une dimension de genre très marquée : 97 % des enfants représentés dans ces contenus générés par IA sont des filles, une surreprésentation encore plus forte que dans les affaires de pédocriminalité réelle. Des cas concrets ont illustré cette dérive, notamment en Espagne à Almendralejo, où des images de lycéennes réelles ont été manipulées par IA pour produire des contenus à caractère sexuel. L'IWF, fondée en 1996 et membre du réseau international INHOPE — auquel appartient également l'association française Point de Contact —, travaille en lien avec les forces de police et les fournisseurs d'accès à internet, auxquels elle transmet notamment une liste noire d'environ 150 000 URL de sites diffusant des contenus illégaux. Ce rapport s'inscrit dans un contexte où la démocratisation des outils de génération d'images et de vidéos par IA pose des défis croissants aux dispositifs légaux et techniques de protection de l'enfance à l'échelle mondiale.

UELe réseau INHOPE, dont fait partie l'association française Point de Contact, est directement impliqué dans la lutte contre ces contenus, et la multiplication de ces matériaux générés par IA accroît la pression sur le cadre réglementaire européen pour encadrer les outils génératifs.

ÉthiqueActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic