Aller au contenu principal
arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an
ÉthiqueNext INpact2j

arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

arXiv, la plateforme de prépublication scientifique de référence, vient d'annoncer une politique de suspension d'un an à l'encontre de tout chercheur soumettant un article dont le contenu généré par intelligence artificielle n'a manifestement pas été vérifié. C'est Thomas Dietterich, responsable adjoint de la plateforme, qui a détaillé la mesure dans un thread publié sur X, en donnant des exemples concrets de preuves irréfutables : des références bibliographiques fantaisistes, des méta-commentaires laissés tels quels par le LLM comme « voici un résumé de 200 mots, souhaitez-vous que j'y apporte des modifications ? », ou encore des tableaux vides accompagnés d'une note invitant l'auteur à les compléter avec ses propres données. Après cette année de bannissement, les auteurs concernés ne pourront soumettre à nouveau que des articles déjà acceptés par une revue ou une conférence avec comité de lecture, ce qui réduit considérablement l'intérêt de passer par arXiv.

La mesure vise à restaurer la confiance dans un espace qui constitue le premier point d'entrée de la recherche mondiale avant la publication formelle. Dietterich a résumé l'enjeu avec une clarté directe : si un article contient des preuves que ses auteurs n'ont pas vérifié les sorties d'un grand modèle de langage, rien dans ce document ne peut être considéré comme fiable. Pour les chercheurs, les ingénieurs et les décideurs qui s'appuient sur arXiv pour suivre l'état de l'art, la prolifération d'articles contaminés par des hallucinations non détectées représente un risque concret sur la qualité des travaux en aval. La politique rappelle également que la signature d'un article engage chaque auteur sur l'intégralité de son contenu, indépendamment de la façon dont ce contenu a été produit.

La décision d'arXiv s'inscrit dans un contexte de saturation progressive de l'écosystème scientifique par les outils génératifs. Revues académiques et actes de conférences font face au même phénomène, et plusieurs éditeurs ont durci leurs politiques ces derniers mois. La plateforme avait déjà explicité dans sa charte de modération que la responsabilité des contenus générés par IA incombait aux auteurs, mais la masse de soumissions problématiques a visiblement rendu nécessaire de rendre la sanction publique et explicite. Des chercheurs comme l'économiste James D. Miller soulèvent des questions légitimes sur la responsabilité collective dans les articles multi-auteurs, notamment lorsqu'un coauteur ne peut pas vérifier une référence dans une langue ou un domaine qui n'est pas le sien. arXiv a indiqué qu'une procédure d'appel existe et que toute sanction doit être documentée et confirmée par le responsable disciplinaire de la plateforme avant d'être appliquée.

Impact France/UE

Les chercheurs européens qui soumettent sur arXiv devront s'assurer de vérifier scrupuleusement tout contenu généré par LLM dans leurs articles, sous peine d'une suspension d'un an qui les priverait du principal canal mondial de prépublication scientifique.

💬 Le point de vue du dev

Quand ton article contient la phrase "souhaitez-vous que j'apporte des modifications ?", c'est pas un bug, c'est une démission de chercheur. Un an de suspension, ça paraît sévère, mais Dietterich a raison sur le fond : si tu n'as pas vérifié les sorties du LLM, ton article entier est suspect. Reste à voir comment ça s'applique aux équipes de vingt auteurs où personne n'a lu la même section.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

arXiv suspend un an les auteurs qui soumettent du contenu IA médiocre
1Ars Technica AI 

arXiv suspend un an les auteurs qui soumettent du contenu IA médiocre

Le serveur de prépublication arXiv, référence mondiale pour la physique, l'astronomie et d'autres disciplines scientifiques, annonce des sanctions sévères contre les soumissions contenant du contenu généré par intelligence artificielle de manière inappropriée. Thomas Dietterich, professeur émérite à l'Oregon State University et membre du conseil consultatif éditorial ainsi que de l'équipe de modération d'arXiv, a révélé la mesure sur les réseaux sociaux : tout auteur reconnu coupable d'avoir soumis du contenu IA non conforme se verra interdit de soumission pendant un an, et toutes ses publications futures devront passer par un processus de révision par les pairs avant d'être hébergées sur la plateforme, et ce de façon permanente. Cette décision répond à une dégradation visible de la qualité des soumissions scientifiques depuis la généralisation des grands modèles de langage. Des citations inventées, des réponses de prompts copiées sans modification et des diagrammes incohérents ont réussi à franchir les filtres des éditeurs et des relecteurs dans plusieurs revues, souvent sans conséquences claires pour leurs auteurs. En ciblant la diffusion avant même la publication formelle, arXiv cherche à endiguer la contamination à la source, protégeant ainsi la crédibilité d'un outil utilisé quotidiennement par des milliers de chercheurs pour partager leurs travaux en amont de la validation officielle. arXiv occupe une place centrale dans l'écosystème scientifique mondial : fondé en 1991, il héberge plus de deux millions de prépublications et constitue souvent le premier point de contact entre chercheurs et nouvelles découvertes. La plateforme n'est pas la seule à durcir le ton : plusieurs revues académiques ont déjà introduit des restrictions explicites sur l'usage de l'IA dans la rédaction scientifique. La mesure annoncée par Dietterich reste à confirmer officiellement par la direction d'arXiv, qui n'avait pas encore répondu aux demandes de précision au moment de la publication. Si elle est validée, elle pourrait faire jurisprudence pour d'autres serveurs de prépublication.

UELes chercheurs français et européens publiant sur arXiv devront s'assurer de la conformité de leurs soumissions aux nouvelles règles d'usage de l'IA, sous peine de suspension d'un an et d'une obligation permanente de relecture par les pairs.

💬 C'est la mesure qu'on attendait depuis qu'on a commencé à voir des prompts bruts copiés-collés dans des papiers de physique. Un an de suspension plus revue permanente obligatoire, ça fait mal, et c'est probablement la seule chose qui fera vraiment réfléchir avant de laisser GPT finir la section "méthodes". Reste à voir si arXiv valide officiellement, parce que pour l'instant c'est un tweet d'un membre du conseil.

ÉthiqueActu
1 source
2Next INpact 

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Google expérimente discrètement une fonctionnalité qui réécrit automatiquement les titres des articles et pages web apparaissant dans ses résultats de recherche, en s'appuyant sur l'intelligence artificielle générative. C'est The Verge qui a mis au jour cette pratique après que plusieurs membres de sa rédaction ont constaté que des titres qu'ils n'avaient jamais rédigés apparaissaient dans Google Search à la place des leurs. L'exemple le plus frappant : le titre complet « J'ai utilisé l'outil IA "tricher sur tout" et cela ne m'a aidé à tricher sur rien » a été réduit à cinq mots, « Outil IA "tricher sur tout" », laissant faussement croire que The Verge promouvait ce type d'outil. Contactés par le média, trois porte-parole de Google, Jennifer Kutz, Mallory De Leon et Ned Adriance, ont confirmé l'existence du test, le qualifiant d'expérience « modeste » et « limitée », non encore autorisée à un déploiement à grande échelle. L'objectif affiché est d'identifier, dans le contenu d'une page, ce qui pourrait constituer un titre plus pertinent par rapport à la requête d'un utilisateur donné. Le problème central est que ces titres réécrits par l'IA sont inexacts et trompeurs, et qu'ils apparaissent sans aucune mention indiquant que Google a substitué ses propres mots à ceux des auteurs originaux. Pour les éditeurs, c'est une atteinte directe à leur ligne éditoriale et à leur capacité à présenter leur propre travail. The Verge souligne avoir investi un effort considérable pour rédiger des titres honnêtes et engageants, sans recourir au clickbait, or l'IA de Google produit précisément l'effet inverse : des formulations tronquées ou détournées qui dénaturent le sens de l'article. Au-delà de l'impact éditorial, la question de la responsabilité juridique se pose : si un titre réécrit par Google induit en erreur un lecteur ou nuit à la réputation d'un média, qui en est responsable ? Ce n'est pas la première fois que Google se retrouve sous le feu des critiques pour ses pratiques de réécriture algorithmique. The Verge avait déjà documenté, à deux reprises ces derniers mois, que l'IA intégrée à Discover, l'algorithme de recommandation de Google, générait des titres racoleurs et factuellement erronés, sans que les éditeurs concernés en soient informés. Cette nouvelle expérience s'inscrit dans une tendance plus large : Google cherche à contrôler toujours davantage la façon dont le contenu tiers est présenté dans son écosystème, au détriment de l'autonomie éditoriale des producteurs de contenu. Mallory De Leon a précisé que si un produit commercial devait naître de cette expérience, il n'utiliserait pas d'IA générative, sans expliquer par quel autre moyen Google remplacerait des titres. La tension entre Google et la presse est ainsi portée à un niveau supplémentaire, dans un contexte où les éditeurs dépendent encore massivement du moteur de recherche pour leur audience.

UELes éditeurs français et européens, déjà fragilisés économiquement, sont exposés à des réécritures de titres non autorisées qui dénaturent leur ligne éditoriale sans information ni consentement préalable.

ÉthiqueOpinion
1 source
3Next INpact 

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Google expérimente actuellement aux États-Unis une fonctionnalité qui réécrit automatiquement, via intelligence artificielle générative, les titres des articles et pages web apparaissant dans ses résultats de recherche. C'est The Verge qui a révélé l'existence de ce test après avoir constaté que plusieurs de ses propres articles affichaient dans Google des titres que sa rédaction n'avait jamais rédigés. Un article intitulé « J'ai utilisé l'outil IA "tricher sur tout" et cela ne m'a aidé à tricher sur rien » s'est ainsi retrouvé réduit à cinq mots, « Outil IA "tricher sur tout" », laissant faussement entendre que The Verge en ferait la promotion. Interrogés, trois porte-parole de Google, Jennifer Kutz, Mallory De Leon et Ned Adriance, ont confirmé l'existence du test, le qualifiant d'expérience « modeste » et « limitée », non encore autorisée à un déploiement à plus grande échelle. Selon leurs explications, l'objectif est d'identifier sur une page le contenu susceptible de constituer un titre plus pertinent par rapport à la requête d'un utilisateur donné. Le problème central est que cette réécriture algorithmique se fait sans aucune indication visible pour l'internaute, et produit parfois des titres qui trahissent le sens original, voire le contredisent. Pour les éditeurs et médias, l'enjeu est considérable : leurs titres, soigneusement formulés pour refléter leur ligne éditoriale, peuvent être remplacés par une version déformée sans leur consentement ni même leur information. The Verge dénonce une atteinte directe à sa capacité à promouvoir son propre travail de manière honnête, soulignant que sa rédaction investit précisément du temps pour éviter le clickbait, une démarche que Google semble court-circuiter en imposant ses propres formulations. Mallory De Leon a certes précisé qu'un éventuel produit final n'utiliserait pas d'IA générative, sans expliquer comment Google envisagerait alors de réécrire des titres autrement. Cette révélation survient dans un contexte déjà tendu entre Google et les médias sur la question des contenus générés ou altérés par IA. The Verge avait documenté à deux reprises ces derniers mois des cas où l'algorithme de recommandation Discover de Google « hallucinait » des titres racoleurs et erronés pour ses articles. La pratique de réécriture des titres n'est pas entièrement nouvelle, Google ajuste les titres affichés dans ses résultats depuis des années via des règles heuristiques, mais le recours à l'IA générative représente un saut qualitatif dans la capacité de déformation du message original. Si ce test devait être généralisé, il soulèverait des questions fondamentales sur le contrôle éditorial à l'ère des moteurs de recherche pilotés par IA, et potentiellement des recours juridiques de la part d'éditeurs dont la réputation pourrait être affectée par des titres qu'ils n'ont pas écrits.

UELes éditeurs et médias français pourraient invoquer la directive européenne sur les droits voisins pour contester cette réécriture non consentie de leurs titres dans les résultats de recherche Google.

ÉthiqueOutil
1 source
Scandale OpenAI : Ils ont créé des journalistes qui n’existent pas !
4Le Big Data 

Scandale OpenAI : Ils ont créé des journalistes qui n’existent pas !

The Wire by Acutus, site d'information lancé le 29 décembre 2025, utilise des agents d'IA qui se présentent comme de vrais journalistes pour obtenir des citations d'experts humains. L'enquête, publiée par Model Republic via The Midas Project, révèle qu'aucun contributeur humain n'est identifiable sur le site, et que le détecteur Pangram estime à 97 % la proportion de contenus générés automatiquement. L'analyse du code source confirme un processus éditorial largement automatisé : sur cinq étapes de révision, une seule implique un humain, pour une durée moyenne de 44 secondes par article. Les enquêteurs ont retrouvé des champs destinés à alimenter l'IA en informations de base, des suggestions de questions d'interview, et un champ nommé « aiOriginalText » permettant de comparer le texte brut généré aux modifications apportées. L'affaire prend une dimension concrète avec Nathan Calvin, vice-président et conseiller juridique de l'association Encode : il a reçu un email d'un certain Michael Chen, se présentant comme journaliste pour Acutus et proposant un questionnaire sur une loi liée à l'IA au Tennessee. Ce journaliste n'existe nulle part en ligne, et l'adresse utilisée était le contact générique du site. Ce cas franchit un seuil inédit par rapport aux fermes à contenus IA déjà documentées. Jusqu'ici, l'IA produisait des textes ; ici, elle contacte de vraies personnes en se faisant passer pour un journaliste, ce qui lui permet d'extraire des citations authentiques pour crédibiliser un contenu entièrement automatisé. Pour les experts sollicités, il est impossible de distinguer un agent IA d'un journaliste humain. Pour l'ensemble du secteur médiatique, cela signifie qu'un processus éditorial complet, de l'interview à la publication, peut désormais s'exécuter sans intervention humaine réelle en moins d'une minute. La dimension politique aggrave les risques : le site cible aussi des voix critiques envers l'IA. Le chercheur John Sherman, défenseur de la sécurité de l'IA, a fait l'objet d'un article à charge accompagné de prises de contact avec les organisations avec lesquelles il collabore. Les liens entre The Wire by Acutus et OpenAI restent indirects mais troublants. Plusieurs articles du site ont été relayés par Patrick Hynes, figure des relations publiques proche du Parti républicain, dont le réseau se connecte à des structures liées à d'importants financements autour de l'IA, certains impliquant des personnalités associées à OpenAI. Aucune implication directe n'est formellement établie, mais l'hypothèse avancée est sensible : ce type de plateforme pourrait servir à diffuser des positions favorables à l'IA sous couvert de journalisme indépendant. L'affaire survient au moment où OpenAI renforce sa présence dans les médias, ayant récemment racheté l'émission TPBN, très suivie dans la Silicon Valley. Elle relance une question urgente : en l'absence de cadre légal imposant la transparence sur l'origine des contenus, rien n'empêche des agents automatisés de mener des interviews et de publier des articles sans que ni les sources humaines ni les lecteurs ne le sachent.

UEL'AI Act européen impose la transparence sur les contenus générés par IA, ce qui rendrait de telles pratiques illicites en Europe, mais l'absence de mécanismes de vérification concrets expose les experts et médias européens à des risques identiques d'interviews menées par des agents automatisés se faisant passer pour des journalistes.

ÉthiqueActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour