Aller au contenu principal
ÉthiqueArs Technica AI1h

arXiv suspend un an les auteurs qui soumettent du contenu IA médiocre

Résumé IASource uniqueImpact UE
Source originale ↗·

Le serveur de prépublication arXiv, référence mondiale pour la physique, l'astronomie et d'autres disciplines scientifiques, annonce des sanctions sévères contre les soumissions contenant du contenu généré par intelligence artificielle de manière inappropriée. Thomas Dietterich, professeur émérite à l'Oregon State University et membre du conseil consultatif éditorial ainsi que de l'équipe de modération d'arXiv, a révélé la mesure sur les réseaux sociaux : tout auteur reconnu coupable d'avoir soumis du contenu IA non conforme se verra interdit de soumission pendant un an, et toutes ses publications futures devront passer par un processus de révision par les pairs avant d'être hébergées sur la plateforme, et ce de façon permanente.

Cette décision répond à une dégradation visible de la qualité des soumissions scientifiques depuis la généralisation des grands modèles de langage. Des citations inventées, des réponses de prompts copiées sans modification et des diagrammes incohérents ont réussi à franchir les filtres des éditeurs et des relecteurs dans plusieurs revues, souvent sans conséquences claires pour leurs auteurs. En ciblant la diffusion avant même la publication formelle, arXiv cherche à endiguer la contamination à la source, protégeant ainsi la crédibilité d'un outil utilisé quotidiennement par des milliers de chercheurs pour partager leurs travaux en amont de la validation officielle.

arXiv occupe une place centrale dans l'écosystème scientifique mondial : fondé en 1991, il héberge plus de deux millions de prépublications et constitue souvent le premier point de contact entre chercheurs et nouvelles découvertes. La plateforme n'est pas la seule à durcir le ton : plusieurs revues académiques ont déjà introduit des restrictions explicites sur l'usage de l'IA dans la rédaction scientifique. La mesure annoncée par Dietterich reste à confirmer officiellement par la direction d'arXiv, qui n'avait pas encore répondu aux demandes de précision au moment de la publication. Si elle est validée, elle pourrait faire jurisprudence pour d'autres serveurs de prépublication.

Impact France/UE

Les chercheurs français et européens publiant sur arXiv devront s'assurer de la conformité de leurs soumissions aux nouvelles règles d'usage de l'IA, sous peine de suspension d'un an et d'une obligation permanente de relecture par les pairs.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder 

Des influenceurs générés par IA inondent les réseaux sociaux de contenus pro-Trump avant les midterms

Des centaines d'avatars générés par intelligence artificielle inondent TikTok, Instagram et YouTube avec des messages de soutien à Donald Trump à l'approche des élections de mi-mandat américaines. Certains de ces comptes ont déjà accumulé plus de 35 000 abonnés et engrangé des millions de vues. Trump lui-même a partagé du contenu produit par IA, ce qui a contribué à amplifier leur portée. L'origine de cette vague reste floue : s'agit-il d'initiatives d'activistes individuels ou d'une campagne coordonnée, personne ne le sait encore avec certitude. Ce phénomène soulève des questions majeures sur l'intégrité de l'information politique en ligne. Des influenceurs virtuels, indiscernables de vraies personnes, peuvent diffuser des messages partisans à grande échelle, sans les contraintes légales ou éthiques qui s'appliquent aux acteurs humains. Pour les plateformes comme TikTok et Meta, la détection et la modération de ce type de contenu représentent un défi technique et politique considérable, d'autant que les algorithmes de recommandation amplifient naturellement les contenus engageants, quelle que soit leur origine. L'utilisation de l'IA à des fins de propagande politique n'est pas nouvelle, mais la facilité avec laquelle ces avatars peuvent être créés et déployés massivement marque un tournant. Après les controverses autour des ingérences étrangères lors des élections de 2016 et 2020, les autorités américaines et les plateformes ont renforcé leurs politiques, sans pour autant anticiper ce scénario. La question de la transparence sur l'origine artificielle du contenu politique devient désormais centrale pour les régulateurs et les législateurs aux États-Unis comme en Europe.

UELa prolifération d'avatars politiques générés par IA interpelle directement les régulateurs européens, le Digital Services Act et l'AI Act imposant des obligations de transparence et de marquage des contenus synthétiques que les plateformes peinent encore à appliquer.

💬 On savait que ça allait arriver, mais la vitesse, là, ça surprend quand même. Des centaines de comptes coordonnés, des millions de vues en quelques semaines, c'est plus de l'expérimentation isolée, c'est une chaîne de production. Le DSA impose le marquage des contenus synthétiques, sur le papier c'est exactement pour ça qu'il existe, mais modérer à cette échelle sur TikTok sans faux positifs massifs, personne ne l'a encore réussi.

ÉthiqueOpinion
1 source
Meta formerait des agents IA en surveillant les souris et claviers de ses employés
2Ars Technica AI 

Meta formerait des agents IA en surveillant les souris et claviers de ses employés

Meta va commencer à collecter les mouvements de souris, clics et frappes clavier de ses employés américains pour entraîner ses futurs agents d'intelligence artificielle. L'initiative, baptisée Model Capability Initiative, a été annoncée en interne via des mémos publiés par l'équipe Meta Superintelligence Labs et révélée par Reuters. Le logiciel de suivi fonctionnera sur des applications et sites web professionnels spécifiques, et prendra également des captures d'écran périodiques pour fournir du contexte aux données d'entraînement. Selon le mémo interne, "c'est là où tous les employés de Meta peuvent aider nos modèles à s'améliorer simplement en faisant leur travail quotidien." Cette approche vise à produire des données d'entraînement de haute qualité pour les agents IA, c'est-à-dire des systèmes capables d'accomplir des tâches complexes de manière autonome sur un ordinateur. Reproduire fidèlement les comportements humains réels dans des environnements de travail concrets est un défi majeur pour ce type d'IA, et les données synthétiques ou publiques ne suffisent plus. En utilisant le travail quotidien de milliers d'employés comme source de données, Meta espère accélérer le développement d'agents capables de naviguer dans des interfaces réelles. Cette initiative s'inscrit dans une course effrénée entre les grandes entreprises technologiques pour développer des agents IA performants, un marché que Microsoft, Google et OpenAI ciblent également activement. La question de la surveillance des employés à des fins commerciales soulève néanmoins des questions éthiques et juridiques, notamment en matière de consentement et de vie privée au travail. Il reste à voir si Meta étendra ce programme à ses employés hors des États-Unis, où les réglementations comme le RGPD européen imposent des contraintes bien plus strictes.

UELe RGPD impose un consentement explicite pour la collecte de données comportementales des employés, rendant une extension de ce programme aux salariés européens de Meta juridiquement très complexe, voire impossible sans refonte du dispositif.

ÉthiqueActu
1 source
Face aux tensions sur les contenus, le fondateur de Mistral AI propose une « taxe IA » pour soutenir les créateurs
3Siècle Digital 

Face aux tensions sur les contenus, le fondateur de Mistral AI propose une « taxe IA » pour soutenir les créateurs

Arthur Menesch, fondateur de Mistral AI, propose l'instauration d'une « taxe IA » — une contribution financière obligatoire pour les entreprises d'IA générative — afin de rémunérer les créateurs dont les contenus protégés par le droit d'auteur ont servi à entraîner les modèles. Cette proposition vise à désamorcer les tensions croissantes entre l'industrie de l'IA et les industries culturelles. Elle s'inscrit dans un débat plus large sur la régulation de l'utilisation des données d'entraînement.

UELa proposition d'une contribution obligatoire des entreprises d'IA générative pourrait directement alimenter les débats législatifs européens sur le droit d'auteur et les données d'entraînement, avec un impact concret pour les industries culturelles françaises et la directive sur le droit d'auteur de l'UE.

ÉthiqueReglementation
1 source
Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant
4Ars Technica AI 

Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant

Une confusion a récemment agité les utilisateurs de Chrome sur ordinateur : certains ont constaté que leur navigateur téléchargeait discrètement un modèle d'intelligence artificielle de 4 Go, le Gemini Nano de Google. Sur les réseaux sociaux, la découverte a été interprétée comme un déploiement massif et soudain d'IA sur toutes les installations Chrome. En réalité, ce comportement n'a rien de nouveau. Google avait annoncé dès 2024 l'intégration de capacités d'IA locale dans Chrome, destinées à alimenter des fonctionnalités comme "Help Me Write" (aide à la rédaction), l'organisation automatique des onglets et la détection des tentatives d'arnaque. Le modèle est téléchargé en arrière-plan depuis plusieurs années déjà, ce n'est pas une nouveauté technique, mais une nouveauté dans la perception des utilisateurs. Ce que cet épisode révèle avant tout, c'est l'incapacité chronique de Google à communiquer clairement sur ses déploiements d'IA. L'entreprise intègre des modèles lourds dans ses produits sans informer explicitement les utilisateurs, ce qui génère régulièrement des incompréhensions et une méfiance justifiée. Pour les 4 milliards d'utilisateurs de Chrome dans le monde, la question de ce qui tourne en local sur leur machine, et pourquoi, est pourtant loin d'être anodine, notamment sur des appareils aux ressources limitées. Ce flou s'inscrit dans une tendance plus large chez Google, qui multiplie les annonces d'IA sans toujours en expliquer les implications concrètes. Chrome embarque désormais bien d'autres fonctionnalités alimentées par Gemini : un chatbot en mode écran partagé, ainsi qu'une capacité à automatiser la navigation web. Le traitement local via Gemini Nano vise à préserver la confidentialité des données en évitant les allers-retours vers les serveurs cloud, un argument de poids face aux critiques sur la vie privée. Reste que sans transparence sur ce qui est installé, quand et pourquoi, la confiance des utilisateurs risque de s'éroder plus vite que les bénéfices de ces fonctionnalités ne s'imposent.

UELes centaines de millions d'utilisateurs européens de Chrome sont concernés par ce manque de transparence de Google sur le déploiement silencieux de Gemini Nano, une pratique potentiellement en tension avec les obligations d'information du RGPD.

ÉthiqueOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour