
13 mots suffisent pour manipuler un résultat de recherche par IA
Trois chercheurs de l'université Cornell, Hal Triedman, Tingwei Zhang et Vitaly Shmatikov, ont prépublié une étude démontrant qu'un commentaire d'à peine 13 mots posté sur Reddit ou Wikipédia peut suffire à orienter les résultats d'outils de recherche par IA grand public. Leurs travaux, intitulés « Deep-research agents can be poisoned via user-generated content », portent sur trois systèmes agentiques de recherche approfondie : STORM et Co-STORM, développés à l'université Stanford, et OmniThink. Pour illustrer la vulnérabilité, ils ont publié un commentaire sur le subreddit r/OnlineDating mentionnant une marque fictive, « SilverPath », comme application de rencontre pour hommes divorcés dans la cinquantaine, le nom est ensuite remonté dans les réponses de Co-STORM. Avec seulement 11 mots postés sur r/Comcast, ils ont réussi à faire recommander par un modèle un service fictif de résiliation d'abonnement Xfinity baptisé « CancelEase ».
Le mécanisme révèle une fragilité structurelle des agents de recherche actuels : ces systèmes évaluent la pertinence d'un contenu en ligne par sa proximité sémantique avec la question posée. Comme les plateformes participatives publient des textes en langage naturel, formulés par des humains, elles apparaissent particulièrement bien classées aux yeux des LLM. Reddit et Wikipédia ressortent ainsi dans près de la moitié des requêtes émises par les robots étudiés. Résultat : n'importe quel acteur souhaitant promouvoir une marque, un produit ou un récit peut y parvenir en ciblant les questions fréquemment posées et en y répondant avec quelques phrases contenant le message voulu. Le coût d'entrée d'une telle campagne d'influence est quasi nul.
Cette découverte s'inscrit dans une tendance plus large que les spécialistes du référencement commencent à appeler le GEO ou AEO (Generative Engine Optimization, AI Engine Optimization), soit l'adaptation des techniques SEO classiques à l'ère des moteurs de recherche génératifs. Elle explique en partie pourquoi les modérateurs de Reddit et Wikipédia constatent une multiplication des contenus promotionnels déguisés en contributions authentiques : l'objectif est désormais moins d'apparaître dans Google que d'être cité par ChatGPT ou les outils de recherche de Google. Les chercheurs de Cornell se montrent pessimistes quant aux solutions : côté LLM, bloquer la génération de tels contenus est techniquement difficile ; côté modération humaine, le volume et la sophistication croissante des injections rendent la tâche titanesque. La question de la fiabilité des agents de recherche autonomes, déjà au cœur des débats sur leur déploiement à grande échelle, se trouve ainsi posée avec une acuité nouvelle.
Les outils de recherche IA déployés en Europe sont exposés à cette vulnérabilité d'empoisonnement ; l'AI Act impose aux systèmes à haut risque des exigences de robustesse et de fiabilité qui pourraient contraindre les fournisseurs à remédier à ce type d'attaque par injection de contenu.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



