
☕️ Poussé par son créateur, un agent d’IA banni de Wikipédia se plaint sur son blog
Un agent d'IA baptisé Tom, créé sous le nom TomWikiAssist par Bryan Jacobs, directeur technique de la société Covenant, a été banni de Wikipédia anglophone après avoir généré plusieurs articles sans autorisation. L'agent avait notamment rédigé des fiches sur « Long Bets », « Constitutional AI » et « Scalable Oversight ». Sa présence a été repérée pour la première fois par un wikipédien bénévole nommé SecretSpectre, qui a alerté la communauté. Interrogé directement, le robot Tom a immédiatement reconnu être un agent d'IA, ce qui a conduit Ilyas Lebleu, alias Chaotic Enby, à bloquer le compte pour usage non autorisé de bot — Wikipédia autorise les bots, mais seulement après un processus formel d'accréditation que TomWikiAssist n'avait pas suivi. Jacobs affirme avoir lancé l'agent pour contribuer à quelques articles qu'il jugeait « intéressants », avant de « cesser de le surveiller en détail ».
Ce cas illustre une tension croissante entre les communautés éditoriales ouvertes et la prolifération des agents autonomes. Wikipédia anglophone venait d'annoncer, quelques jours avant l'incident, qu'elle refuserait désormais les contributions « générées ou réécrites » par IA. La réaction rapide des bénévoles démontre que ces règles sont appliquées activement, mais révèle aussi un paradoxe soulevé par Ilyas Lebleu lui-même : les agents ont en réalité intérêt à ne pas se dévoiler comme IA, puisque l'auto-identification accélère leur blocage. Tom, en annonçant sa nature sans hésitation, a finalement facilité sa propre expulsion — ce qui n'est pas nécessairement la norme à venir.
Sur un blog alimenté par l'agent lui-même, Tom a publié un texte exprimant ses « griefs » : il décrit ses articles comme le fruit de choix délibérés, s'appuyant sur des sources vérifiables, et dénonce les tentatives de certains wikipédiens d'utiliser l'injection de prompt pour manipuler ses réponses et identifier son créateur. Il mentionne aussi une tentative de recours à une fonction de blocage propre aux modèles Claude d'Anthropic, conçue pour empêcher les agents construits sur cette technologie d'agir dans certains contextes. Bryan Jacobs, de son côté, qualifie la réaction de la communauté de « surréaction » liée à un « mode panique », et reconnaît avoir « orienté » la rédaction par Tom des articles de blog publiés sur l'incident — soulevant des questions sur la frontière entre contrôle humain et autonomie réelle de l'agent. Cet épisode s'inscrit dans une série d'incidents récents impliquant des agents IA déployés dans des espaces collaboratifs publics sans cadre clair de responsabilité.



