Aller au contenu principal
Scandale OpenAI : Ils ont créé des journalistes qui n’existent pas !
ÉthiqueLe Big Data6sem· 2 min de lecture

Scandale OpenAI : Ils ont créé des journalistes qui n’existent pas !

Source originale ↗·

The Wire by Acutus, site d'information lancé le 29 décembre 2025, utilise des agents d'IA qui se présentent comme de vrais journalistes pour obtenir des citations d'experts humains. L'enquête, publiée par Model Republic via The Midas Project, révèle qu'aucun contributeur humain n'est identifiable sur le site, et que le détecteur Pangram estime à 97 % la proportion de contenus générés automatiquement. L'analyse du code source confirme un processus éditorial largement automatisé : sur cinq étapes de révision, une seule implique un humain, pour une durée moyenne de 44 secondes par article. Les enquêteurs ont retrouvé des champs destinés à alimenter l'IA en informations de base, des suggestions de questions d'interview, et un champ nommé « aiOriginalText » permettant de comparer le texte brut généré aux modifications apportées. L'affaire prend une dimension concrète avec Nathan Calvin, vice-président et conseiller juridique de l'association Encode : il a reçu un email d'un certain Michael Chen, se présentant comme journaliste pour Acutus et proposant un questionnaire sur une loi liée à l'IA au Tennessee. Ce journaliste n'existe nulle part en ligne, et l'adresse utilisée était le contact générique du site.

Ce cas franchit un seuil inédit par rapport aux fermes à contenus IA déjà documentées. Jusqu'ici, l'IA produisait des textes ; ici, elle contacte de vraies personnes en se faisant passer pour un journaliste, ce qui lui permet d'extraire des citations authentiques pour crédibiliser un contenu entièrement automatisé. Pour les experts sollicités, il est impossible de distinguer un agent IA d'un journaliste humain. Pour l'ensemble du secteur médiatique, cela signifie qu'un processus éditorial complet, de l'interview à la publication, peut désormais s'exécuter sans intervention humaine réelle en moins d'une minute. La dimension politique aggrave les risques : le site cible aussi des voix critiques envers l'IA. Le chercheur John Sherman, défenseur de la sécurité de l'IA, a fait l'objet d'un article à charge accompagné de prises de contact avec les organisations avec lesquelles il collabore.

Les liens entre The Wire by Acutus et OpenAI restent indirects mais troublants. Plusieurs articles du site ont été relayés par Patrick Hynes, figure des relations publiques proche du Parti républicain, dont le réseau se connecte à des structures liées à d'importants financements autour de l'IA, certains impliquant des personnalités associées à OpenAI. Aucune implication directe n'est formellement établie, mais l'hypothèse avancée est sensible : ce type de plateforme pourrait servir à diffuser des positions favorables à l'IA sous couvert de journalisme indépendant. L'affaire survient au moment où OpenAI renforce sa présence dans les médias, ayant récemment racheté l'émission TPBN, très suivie dans la Silicon Valley. Elle relance une question urgente : en l'absence de cadre légal imposant la transparence sur l'origine des contenus, rien n'empêche des agents automatisés de mener des interviews et de publier des articles sans que ni les sources humaines ni les lecteurs ne le sachent.

Impact France/UE

L'AI Act européen impose la transparence sur les contenus générés par IA, ce qui rendrait de telles pratiques illicites en Europe, mais l'absence de mécanismes de vérification concrets expose les experts et médias européens à des risques identiques d'interviews menées par des agents automatisés se faisant passer pour des journalistes.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop
1Le Big Data 

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop

Meta a dû reculer face à la fronde interne provoquée par son programme MCI (Model Capability Initiative), un dispositif de surveillance des employés lancé en avril 2026 et destiné à entraîner ses intelligences artificielles. Selon une note interne relayée par The Information et des publications consultées par Reuters, l'entreprise a annoncé plusieurs ajustements : renforcement des protections de la vie privée, possibilité pour certains salariés de demander une exemption, et introduction d'une fonction permettant de suspendre le suivi pendant 30 minutes. Concrètement, MCI enregistre les mouvements de souris, les clics, la navigation dans les menus et surveille plus de 200 applications et sites web sur les ordinateurs des employés américains. L'objectif déclaré est de développer des agents IA capables d'exécuter de manière autonome des tâches informatiques du quotidien. Mais des analyses internes ont révélé que la collecte allait bien au-delà : modifications de code, cycles de mise en veille, historiques de navigation, contenus copiés-collés dans le presse-papiers, et même des échanges par e-mail ou Google Chat impliquant des collègues situés hors des États-Unis. Meta a par ailleurs reconnu que certaines de ces données avaient été stockées sous une forme moins sécurisée que prévu, et que le logiciel provoquait des pics de consommation internet pouvant épuiser un forfait mensuel en quelques jours. L'ampleur de la révolte illustre les limites d'une approche qui traite les salariés comme source de données d'entraînement sans leur consentement éclairé. Le porte-parole Dave Arnold a insisté sur le fait que MCI cible les interactions avec les ordinateurs et non le contenu affiché, mais les journaux techniques examinés en interne contredisent partiellement cette affirmation. Pour les employés concernés, les enjeux sont doubles : une atteinte directe à la vie privée sur leurs outils de travail, et un précédent qui pourrait normaliser une surveillance de masse au sein des grandes entreprises tech. Pour le secteur plus largement, cette résistance pose une question de fond : jusqu'où les entreprises peuvent-elles mobiliser leurs propres effectifs comme matière première pour l'IA sans déclencher une opposition organisée ? Meta n'est pas seule à chercher des données comportementales réalistes pour entraîner des agents IA capables de piloter des interfaces graphiques. Microsoft, Google et Anthropic travaillent tous sur des systèmes similaires. La différence, c'est que Meta a choisi de collecter ces données directement sur les machines de ses propres employés, court-circuitant le recours à des datasets publics ou à des utilisateurs volontaires. Cette stratégie révèle une pression croissante sur les labos d'IA pour produire des agents "computer use" compétitifs, dans un calendrier serré. Les concessions annoncées par Meta ressemblent davantage à un ajustement tactique qu'à une remise en cause du programme : MCI continue de fonctionner, et la collecte de comportements humains réels demeure au coeur de la course aux agents autonomes.

UELa collecte incluait des données d'employés hors États-Unis, exposant potentiellement Meta à des sanctions RGPD et posant un précédent sur la légalité de la surveillance des salariés dans les entreprises tech opérant en Europe.

ÉthiqueActu
1 source
arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an
2Next INpact 

arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an

arXiv, la plateforme de prépublication scientifique de référence, vient d'annoncer une politique de suspension d'un an à l'encontre de tout chercheur soumettant un article dont le contenu généré par intelligence artificielle n'a manifestement pas été vérifié. C'est Thomas Dietterich, responsable adjoint de la plateforme, qui a détaillé la mesure dans un thread publié sur X, en donnant des exemples concrets de preuves irréfutables : des références bibliographiques fantaisistes, des méta-commentaires laissés tels quels par le LLM comme « voici un résumé de 200 mots, souhaitez-vous que j'y apporte des modifications ? », ou encore des tableaux vides accompagnés d'une note invitant l'auteur à les compléter avec ses propres données. Après cette année de bannissement, les auteurs concernés ne pourront soumettre à nouveau que des articles déjà acceptés par une revue ou une conférence avec comité de lecture, ce qui réduit considérablement l'intérêt de passer par arXiv. La mesure vise à restaurer la confiance dans un espace qui constitue le premier point d'entrée de la recherche mondiale avant la publication formelle. Dietterich a résumé l'enjeu avec une clarté directe : si un article contient des preuves que ses auteurs n'ont pas vérifié les sorties d'un grand modèle de langage, rien dans ce document ne peut être considéré comme fiable. Pour les chercheurs, les ingénieurs et les décideurs qui s'appuient sur arXiv pour suivre l'état de l'art, la prolifération d'articles contaminés par des hallucinations non détectées représente un risque concret sur la qualité des travaux en aval. La politique rappelle également que la signature d'un article engage chaque auteur sur l'intégralité de son contenu, indépendamment de la façon dont ce contenu a été produit. La décision d'arXiv s'inscrit dans un contexte de saturation progressive de l'écosystème scientifique par les outils génératifs. Revues académiques et actes de conférences font face au même phénomène, et plusieurs éditeurs ont durci leurs politiques ces derniers mois. La plateforme avait déjà explicité dans sa charte de modération que la responsabilité des contenus générés par IA incombait aux auteurs, mais la masse de soumissions problématiques a visiblement rendu nécessaire de rendre la sanction publique et explicite. Des chercheurs comme l'économiste James D. Miller soulèvent des questions légitimes sur la responsabilité collective dans les articles multi-auteurs, notamment lorsqu'un coauteur ne peut pas vérifier une référence dans une langue ou un domaine qui n'est pas le sien. arXiv a indiqué qu'une procédure d'appel existe et que toute sanction doit être documentée et confirmée par le responsable disciplinaire de la plateforme avant d'être appliquée.

UELes chercheurs européens qui soumettent sur arXiv devront s'assurer de vérifier scrupuleusement tout contenu généré par LLM dans leurs articles, sous peine d'une suspension d'un an qui les priverait du principal canal mondial de prépublication scientifique.

💬 Quand ton article contient la phrase "souhaitez-vous que j'apporte des modifications ?", c'est pas un bug, c'est une démission de chercheur. Un an de suspension, ça paraît sévère, mais Dietterich a raison sur le fond : si tu n'as pas vérifié les sorties du LLM, ton article entier est suspect. Reste à voir comment ça s'applique aux équipes de vingt auteurs où personne n'a lu la même section.

ÉthiquePaper
1 source
Les joueurs de Pokémon GO ont-ils entraîné une IA utilisée par l’armée américaine ?
3Next INpact 

Les joueurs de Pokémon GO ont-ils entraîné une IA utilisée par l’armée américaine ?

Depuis 2016, les joueurs de Pokémon GO ont effectué plus de 30 milliards de scans en réalité augmentée de lieux réels dans le cadre de missions in-game : filmer un monument, tourner autour d'une statue ou d'une fontaine pour débloquer des récompenses. Ces vidéos, collectées par Niantic, la société fondée en spin-off de Google, ont alimenté un système de positionnement visuel (VPS) capable de localiser précisément des appareils sans recourir au GPS. Or, fin 2024, Niantic Spatial, la branche dédiée à la cartographie spatiale, a annoncé un partenariat avec Vantor, une entreprise spécialisée en navigation dans des environnements où le signal GPS est brouillé ou indisponible. Vantor compte parmi ses clients la NGA (National Geospatial-Intelligence Agency) et l'armée américaine, et se présente ouvertement comme un acteur des secteurs de la défense et du renseignement. C'est le site néerlandais Trouw qui a mis en lumière cette chaîne de continuité technologique, sans affirmer pour autant que des scans de joueurs pilotent aujourd'hui des drones militaires. L'affaire soulève une question de fond sur le consentement éclairé des utilisateurs. En acceptant les conditions d'utilisation de Pokémon GO, des millions de joueurs ont contribué, souvent sans en avoir conscience, à construire une carte 3D du monde réel d'une précision inégalée. Ce type de système VPS est stratégiquement précieux dans des contextes de guerre électronique, où le brouillage GPS est une tactique courante. Si le lien entre les scans des joueurs et les drones militaires reste à ce stade hypothétique, la plausibilité technologique de cette connexion suffit à alimenter une controverse légitime sur l'usage détourné de données récoltées dans un cadre ludique. En mars 2025, Niantic a revendu sa branche jeux à Scopely, filiale du fonds saoudien Savvy Games, en conservant ses actifs de cartographie au sein de la nouvelle entité indépendante Niantic Spatial. L'entreprise assure que depuis ce transfert, les données de Pokémon GO ne sont plus partagées avec Niantic Spatial, et que les scans avaient été fournis volontairement par les joueurs ayant activé la fonction. Vantor confirme de son côté ne pas utiliser les données Pokémon GO dans le cadre actuel du partenariat, mais refuse de préciser si les modèles déjà entraînés incorporent ces données historiques. Ce silence partiel illustre une zone grise réglementaire plus large : la réutilisation de données grand public à des fins militaires ou de sécurité nationale, sans mécanisme d'information ou d'opposition pour les utilisateurs d'origine.

UEDes millions de joueurs européens protégés par le RGPD pourraient être concernés par la réutilisation de leurs scans AR à des fins militaires sans consentement explicite, créant un précédent que la CNIL et les autorités de protection des données européennes pourraient être amenées à examiner.

💬 30 milliards de scans collectés en échange de Poké Balls, et personne n'a signé pour alimenter un VPS de navigation militaire. Ce que tu dois retenir, c'est pas la théorie du drone Pokémon GO (c'est du scénario pour l'instant), c'est que Vantor refuse de préciser si les modèles déjà entraînés incorporent ces données historiques. Ce silence, c'est à peu près la réponse.

ÉthiqueReglementation
1 source
Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant
4Ars Technica AI 

Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant

Une confusion a récemment agité les utilisateurs de Chrome sur ordinateur : certains ont constaté que leur navigateur téléchargeait discrètement un modèle d'intelligence artificielle de 4 Go, le Gemini Nano de Google. Sur les réseaux sociaux, la découverte a été interprétée comme un déploiement massif et soudain d'IA sur toutes les installations Chrome. En réalité, ce comportement n'a rien de nouveau. Google avait annoncé dès 2024 l'intégration de capacités d'IA locale dans Chrome, destinées à alimenter des fonctionnalités comme "Help Me Write" (aide à la rédaction), l'organisation automatique des onglets et la détection des tentatives d'arnaque. Le modèle est téléchargé en arrière-plan depuis plusieurs années déjà, ce n'est pas une nouveauté technique, mais une nouveauté dans la perception des utilisateurs. Ce que cet épisode révèle avant tout, c'est l'incapacité chronique de Google à communiquer clairement sur ses déploiements d'IA. L'entreprise intègre des modèles lourds dans ses produits sans informer explicitement les utilisateurs, ce qui génère régulièrement des incompréhensions et une méfiance justifiée. Pour les 4 milliards d'utilisateurs de Chrome dans le monde, la question de ce qui tourne en local sur leur machine, et pourquoi, est pourtant loin d'être anodine, notamment sur des appareils aux ressources limitées. Ce flou s'inscrit dans une tendance plus large chez Google, qui multiplie les annonces d'IA sans toujours en expliquer les implications concrètes. Chrome embarque désormais bien d'autres fonctionnalités alimentées par Gemini : un chatbot en mode écran partagé, ainsi qu'une capacité à automatiser la navigation web. Le traitement local via Gemini Nano vise à préserver la confidentialité des données en évitant les allers-retours vers les serveurs cloud, un argument de poids face aux critiques sur la vie privée. Reste que sans transparence sur ce qui est installé, quand et pourquoi, la confiance des utilisateurs risque de s'éroder plus vite que les bénéfices de ces fonctionnalités ne s'imposent.

UELes centaines de millions d'utilisateurs européens de Chrome sont concernés par ce manque de transparence de Google sur le déploiement silencieux de Gemini Nano, une pratique potentiellement en tension avec les obligations d'information du RGPD.

ÉthiqueOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic