Aller au contenu principal
ÉthiqueNext INpact7sem

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Résumé IASource uniqueImpact UE
Source originale ↗·

Google expérimente discrètement une fonctionnalité qui réécrit automatiquement les titres des articles et pages web apparaissant dans ses résultats de recherche, en s'appuyant sur l'intelligence artificielle générative. C'est The Verge qui a mis au jour cette pratique après que plusieurs membres de sa rédaction ont constaté que des titres qu'ils n'avaient jamais rédigés apparaissaient dans Google Search à la place des leurs. L'exemple le plus frappant : le titre complet « J'ai utilisé l'outil IA "tricher sur tout" et cela ne m'a aidé à tricher sur rien » a été réduit à cinq mots, « Outil IA "tricher sur tout" », laissant faussement croire que The Verge promouvait ce type d'outil. Contactés par le média, trois porte-parole de Google, Jennifer Kutz, Mallory De Leon et Ned Adriance, ont confirmé l'existence du test, le qualifiant d'expérience « modeste » et « limitée », non encore autorisée à un déploiement à grande échelle. L'objectif affiché est d'identifier, dans le contenu d'une page, ce qui pourrait constituer un titre plus pertinent par rapport à la requête d'un utilisateur donné.

Le problème central est que ces titres réécrits par l'IA sont inexacts et trompeurs, et qu'ils apparaissent sans aucune mention indiquant que Google a substitué ses propres mots à ceux des auteurs originaux. Pour les éditeurs, c'est une atteinte directe à leur ligne éditoriale et à leur capacité à présenter leur propre travail. The Verge souligne avoir investi un effort considérable pour rédiger des titres honnêtes et engageants, sans recourir au clickbait, or l'IA de Google produit précisément l'effet inverse : des formulations tronquées ou détournées qui dénaturent le sens de l'article. Au-delà de l'impact éditorial, la question de la responsabilité juridique se pose : si un titre réécrit par Google induit en erreur un lecteur ou nuit à la réputation d'un média, qui en est responsable ?

Ce n'est pas la première fois que Google se retrouve sous le feu des critiques pour ses pratiques de réécriture algorithmique. The Verge avait déjà documenté, à deux reprises ces derniers mois, que l'IA intégrée à Discover, l'algorithme de recommandation de Google, générait des titres racoleurs et factuellement erronés, sans que les éditeurs concernés en soient informés. Cette nouvelle expérience s'inscrit dans une tendance plus large : Google cherche à contrôler toujours davantage la façon dont le contenu tiers est présenté dans son écosystème, au détriment de l'autonomie éditoriale des producteurs de contenu. Mallory De Leon a précisé que si un produit commercial devait naître de cette expérience, il n'utiliserait pas d'IA générative, sans expliquer par quel autre moyen Google remplacerait des titres. La tension entre Google et la presse est ainsi portée à un niveau supplémentaire, dans un contexte où les éditeurs dépendent encore massivement du moteur de recherche pour leur audience.

Impact France/UE

Les éditeurs français et européens, déjà fragilisés économiquement, sont exposés à des réécritures de titres non autorisées qui dénaturent leur ligne éditoriale sans information ni consentement préalable.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Next INpact 

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Google expérimente actuellement aux États-Unis une fonctionnalité qui réécrit automatiquement, via intelligence artificielle générative, les titres des articles et pages web apparaissant dans ses résultats de recherche. C'est The Verge qui a révélé l'existence de ce test après avoir constaté que plusieurs de ses propres articles affichaient dans Google des titres que sa rédaction n'avait jamais rédigés. Un article intitulé « J'ai utilisé l'outil IA "tricher sur tout" et cela ne m'a aidé à tricher sur rien » s'est ainsi retrouvé réduit à cinq mots, « Outil IA "tricher sur tout" », laissant faussement entendre que The Verge en ferait la promotion. Interrogés, trois porte-parole de Google, Jennifer Kutz, Mallory De Leon et Ned Adriance, ont confirmé l'existence du test, le qualifiant d'expérience « modeste » et « limitée », non encore autorisée à un déploiement à plus grande échelle. Selon leurs explications, l'objectif est d'identifier sur une page le contenu susceptible de constituer un titre plus pertinent par rapport à la requête d'un utilisateur donné. Le problème central est que cette réécriture algorithmique se fait sans aucune indication visible pour l'internaute, et produit parfois des titres qui trahissent le sens original, voire le contredisent. Pour les éditeurs et médias, l'enjeu est considérable : leurs titres, soigneusement formulés pour refléter leur ligne éditoriale, peuvent être remplacés par une version déformée sans leur consentement ni même leur information. The Verge dénonce une atteinte directe à sa capacité à promouvoir son propre travail de manière honnête, soulignant que sa rédaction investit précisément du temps pour éviter le clickbait, une démarche que Google semble court-circuiter en imposant ses propres formulations. Mallory De Leon a certes précisé qu'un éventuel produit final n'utiliserait pas d'IA générative, sans expliquer comment Google envisagerait alors de réécrire des titres autrement. Cette révélation survient dans un contexte déjà tendu entre Google et les médias sur la question des contenus générés ou altérés par IA. The Verge avait documenté à deux reprises ces derniers mois des cas où l'algorithme de recommandation Discover de Google « hallucinait » des titres racoleurs et erronés pour ses articles. La pratique de réécriture des titres n'est pas entièrement nouvelle, Google ajuste les titres affichés dans ses résultats depuis des années via des règles heuristiques, mais le recours à l'IA générative représente un saut qualitatif dans la capacité de déformation du message original. Si ce test devait être généralisé, il soulèverait des questions fondamentales sur le contrôle éditorial à l'ère des moteurs de recherche pilotés par IA, et potentiellement des recours juridiques de la part d'éditeurs dont la réputation pourrait être affectée par des titres qu'ils n'ont pas écrits.

UELes éditeurs et médias français pourraient invoquer la directive européenne sur les droits voisins pour contester cette réécriture non consentie de leurs titres dans les résultats de recherche Google.

ÉthiqueOutil
1 source
Le coût caché des paramètres IA par défaut de Google et l'illusion du choix
2Ars Technica AI 

Le coût caché des paramètres IA par défaut de Google et l'illusion du choix

Google pousse activement son assistant Gemini dans l'ensemble de son écosystème de produits, des messageries Gmail aux espaces de stockage Google Drive, transformant ses services les plus utilisés en terrain d'entraînement et de déploiement pour l'intelligence artificielle générative. La firme de Mountain View justifie cette intégration massive par une nécessité technique : l'IA générative exige des volumes considérables de données, et Google en dispose via ses centaines de millions d'utilisateurs actifs. Concrètement, Gemini peut accéder au contenu des emails, des documents et des fichiers personnels stockés dans les services Google. Ce déploiement soulève des questions sérieuses de confidentialité, d'autant plus que les règles de rétention des données varient selon la façon dont l'utilisateur accède à l'IA, une complexité délibérée qui rend difficile toute évaluation claire des risques. Tenter de se soustraire à la collecte de données expose les utilisateurs à ce que les experts en UX appellent des "dark patterns" : des éléments d'interface conçus pour décourager les refus, orienter vers le consentement par défaut et rendre la désinscription intentionnellement fastidieuse. Cette situation illustre une tension croissante entre les intérêts commerciaux des grandes plateformes technologiques et le droit des utilisateurs à contrôler leurs données. Alors que la bulle de l'IA générative suscite un scepticisme grandissant dans une partie de l'industrie, Google accélère son intégration au risque d'alimenter les critiques des régulateurs européens et américains déjà attentifs aux pratiques anticoncurrentielles et aux violations potentielles du RGPD. La question de savoir si les utilisateurs disposent d'un vrai choix ou d'une simple illusion de choix devient centrale.

UELes pratiques de collecte de données de Google via Gemini exposent des centaines de millions d'utilisateurs européens à des risques de violation du RGPD, les dark patterns rendant la désinscription délibérément fastidieuse et la rétention des données opaque.

ÉthiqueReglementation
1 source
arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an
3Next INpact 

arXiv : les chercheurs qui soumettent des articles genAI erronés seront suspendus un an

arXiv, la plateforme de prépublication scientifique de référence, vient d'annoncer une politique de suspension d'un an à l'encontre de tout chercheur soumettant un article dont le contenu généré par intelligence artificielle n'a manifestement pas été vérifié. C'est Thomas Dietterich, responsable adjoint de la plateforme, qui a détaillé la mesure dans un thread publié sur X, en donnant des exemples concrets de preuves irréfutables : des références bibliographiques fantaisistes, des méta-commentaires laissés tels quels par le LLM comme « voici un résumé de 200 mots, souhaitez-vous que j'y apporte des modifications ? », ou encore des tableaux vides accompagnés d'une note invitant l'auteur à les compléter avec ses propres données. Après cette année de bannissement, les auteurs concernés ne pourront soumettre à nouveau que des articles déjà acceptés par une revue ou une conférence avec comité de lecture, ce qui réduit considérablement l'intérêt de passer par arXiv. La mesure vise à restaurer la confiance dans un espace qui constitue le premier point d'entrée de la recherche mondiale avant la publication formelle. Dietterich a résumé l'enjeu avec une clarté directe : si un article contient des preuves que ses auteurs n'ont pas vérifié les sorties d'un grand modèle de langage, rien dans ce document ne peut être considéré comme fiable. Pour les chercheurs, les ingénieurs et les décideurs qui s'appuient sur arXiv pour suivre l'état de l'art, la prolifération d'articles contaminés par des hallucinations non détectées représente un risque concret sur la qualité des travaux en aval. La politique rappelle également que la signature d'un article engage chaque auteur sur l'intégralité de son contenu, indépendamment de la façon dont ce contenu a été produit. La décision d'arXiv s'inscrit dans un contexte de saturation progressive de l'écosystème scientifique par les outils génératifs. Revues académiques et actes de conférences font face au même phénomène, et plusieurs éditeurs ont durci leurs politiques ces derniers mois. La plateforme avait déjà explicité dans sa charte de modération que la responsabilité des contenus générés par IA incombait aux auteurs, mais la masse de soumissions problématiques a visiblement rendu nécessaire de rendre la sanction publique et explicite. Des chercheurs comme l'économiste James D. Miller soulèvent des questions légitimes sur la responsabilité collective dans les articles multi-auteurs, notamment lorsqu'un coauteur ne peut pas vérifier une référence dans une langue ou un domaine qui n'est pas le sien. arXiv a indiqué qu'une procédure d'appel existe et que toute sanction doit être documentée et confirmée par le responsable disciplinaire de la plateforme avant d'être appliquée.

UELes chercheurs européens qui soumettent sur arXiv devront s'assurer de vérifier scrupuleusement tout contenu généré par LLM dans leurs articles, sous peine d'une suspension d'un an qui les priverait du principal canal mondial de prépublication scientifique.

💬 Quand ton article contient la phrase "souhaitez-vous que j'apporte des modifications ?", c'est pas un bug, c'est une démission de chercheur. Un an de suspension, ça paraît sévère, mais Dietterich a raison sur le fond : si tu n'as pas vérifié les sorties du LLM, ton article entier est suspect. Reste à voir comment ça s'applique aux équipes de vingt auteurs où personne n'a lu la même section.

ÉthiquePaper
1 source
Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant
4Ars Technica AI 

Google n'a pas modifié les fonctions IA locales de Chrome, elles restent aussi confuses qu'avant

Une confusion a récemment agité les utilisateurs de Chrome sur ordinateur : certains ont constaté que leur navigateur téléchargeait discrètement un modèle d'intelligence artificielle de 4 Go, le Gemini Nano de Google. Sur les réseaux sociaux, la découverte a été interprétée comme un déploiement massif et soudain d'IA sur toutes les installations Chrome. En réalité, ce comportement n'a rien de nouveau. Google avait annoncé dès 2024 l'intégration de capacités d'IA locale dans Chrome, destinées à alimenter des fonctionnalités comme "Help Me Write" (aide à la rédaction), l'organisation automatique des onglets et la détection des tentatives d'arnaque. Le modèle est téléchargé en arrière-plan depuis plusieurs années déjà, ce n'est pas une nouveauté technique, mais une nouveauté dans la perception des utilisateurs. Ce que cet épisode révèle avant tout, c'est l'incapacité chronique de Google à communiquer clairement sur ses déploiements d'IA. L'entreprise intègre des modèles lourds dans ses produits sans informer explicitement les utilisateurs, ce qui génère régulièrement des incompréhensions et une méfiance justifiée. Pour les 4 milliards d'utilisateurs de Chrome dans le monde, la question de ce qui tourne en local sur leur machine, et pourquoi, est pourtant loin d'être anodine, notamment sur des appareils aux ressources limitées. Ce flou s'inscrit dans une tendance plus large chez Google, qui multiplie les annonces d'IA sans toujours en expliquer les implications concrètes. Chrome embarque désormais bien d'autres fonctionnalités alimentées par Gemini : un chatbot en mode écran partagé, ainsi qu'une capacité à automatiser la navigation web. Le traitement local via Gemini Nano vise à préserver la confidentialité des données en évitant les allers-retours vers les serveurs cloud, un argument de poids face aux critiques sur la vie privée. Reste que sans transparence sur ce qui est installé, quand et pourquoi, la confiance des utilisateurs risque de s'éroder plus vite que les bénéfices de ces fonctionnalités ne s'imposent.

UELes centaines de millions d'utilisateurs européens de Chrome sont concernés par ce manque de transparence de Google sur le déploiement silencieux de Gemini Nano, une pratique potentiellement en tension avec les obligations d'information du RGPD.

ÉthiqueOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour