
arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an
arXiv, la plateforme de prépublication scientifique de référence, vient d'annoncer une politique de suspension d'un an à l'encontre de tout chercheur soumettant un article dont le contenu généré par intelligence artificielle n'a manifestement pas été vérifié. C'est Thomas Dietterich, responsable adjoint de la plateforme, qui a détaillé la mesure dans un thread publié sur X, en donnant des exemples concrets de preuves irréfutables : des références bibliographiques fantaisistes, des méta-commentaires laissés tels quels par le LLM comme « voici un résumé de 200 mots, souhaitez-vous que j'y apporte des modifications ? », ou encore des tableaux vides accompagnés d'une note invitant l'auteur à les compléter avec ses propres données. Après cette année de bannissement, les auteurs concernés ne pourront soumettre à nouveau que des articles déjà acceptés par une revue ou une conférence avec comité de lecture, ce qui réduit considérablement l'intérêt de passer par arXiv.
La mesure vise à restaurer la confiance dans un espace qui constitue le premier point d'entrée de la recherche mondiale avant la publication formelle. Dietterich a résumé l'enjeu avec une clarté directe : si un article contient des preuves que ses auteurs n'ont pas vérifié les sorties d'un grand modèle de langage, rien dans ce document ne peut être considéré comme fiable. Pour les chercheurs, les ingénieurs et les décideurs qui s'appuient sur arXiv pour suivre l'état de l'art, la prolifération d'articles contaminés par des hallucinations non détectées représente un risque concret sur la qualité des travaux en aval. La politique rappelle également que la signature d'un article engage chaque auteur sur l'intégralité de son contenu, indépendamment de la façon dont ce contenu a été produit.
La décision d'arXiv s'inscrit dans un contexte de saturation progressive de l'écosystème scientifique par les outils génératifs. Revues académiques et actes de conférences font face au même phénomène, et plusieurs éditeurs ont durci leurs politiques ces derniers mois. La plateforme avait déjà explicité dans sa charte de modération que la responsabilité des contenus générés par IA incombait aux auteurs, mais la masse de soumissions problématiques a visiblement rendu nécessaire de rendre la sanction publique et explicite. Des chercheurs comme l'économiste James D. Miller soulèvent des questions légitimes sur la responsabilité collective dans les articles multi-auteurs, notamment lorsqu'un coauteur ne peut pas vérifier une référence dans une langue ou un domaine qui n'est pas le sien. arXiv a indiqué qu'une procédure d'appel existe et que toute sanction doit être documentée et confirmée par le responsable disciplinaire de la plateforme avant d'être appliquée.
Les chercheurs européens qui soumettent sur arXiv devront s'assurer de vérifier scrupuleusement tout contenu généré par LLM dans leurs articles, sous peine d'une suspension d'un an qui les priverait du principal canal mondial de prépublication scientifique.
Quand ton article contient la phrase "souhaitez-vous que j'apporte des modifications ?", c'est pas un bug, c'est une démission de chercheur. Un an de suspension, ça paraît sévère, mais Dietterich a raison sur le fond : si tu n'as pas vérifié les sorties du LLM, ton article entier est suspect. Reste à voir comment ça s'applique aux équipes de vingt auteurs où personne n'a lu la même section.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.


