Aller au contenu principal
5 raisons de partager moins d'informations avec votre chatbot (et comment corriger vos erreurs passées)
SécuritéZDNET AI12sem· 1 min de lecture

5 raisons de partager moins d'informations avec votre chatbot (et comment corriger vos erreurs passées)

Source originale ↗·

Les conversations que des millions d'utilisateurs échangent quotidiennement avec des chatbots comme ChatGPT, Gemini ou Claude contiennent souvent des informations bien plus sensibles qu'ils ne le réalisent : numéros de sécurité sociale, coordonnées bancaires, problèmes de santé, conflits personnels, secrets professionnels. Ces données sont stockées par les entreprises qui opèrent ces services, parfois utilisées pour entraîner de futurs modèles, et potentiellement exposées en cas de fuite ou de réquisition judiciaire.

Les risques sont multiples et concrets. Un employé qui colle un contrat confidentiel pour que l'IA le résume expose son entreprise à une violation de données. Un utilisateur qui décrit ses symptômes médicaux alimente une base de données commerciale. Même des détails anodins — préférences politiques, habitudes financières, relations familiales — constituent un profil exploitable à des fins publicitaires, d'assurance ou, dans certaines juridictions, de surveillance. Contrairement à une recherche Google, le registre conversationnel d'un chatbot révèle l'intention, le contexte et l'état émotionnel.

La prise de conscience autour de ces risques monte, portée par des incidents comme la fuite de données Samsung via ChatGPT en 2023, où des ingénieurs avaient partagé du code source propriétaire. La plupart des plateformes offrent désormais des options pour désactiver l'historique des conversations ou soumettre une demande de suppression des données — des gestes simples que la majorité des utilisateurs ignorent. Lire les paramètres de confidentialité, éviter de partager des informations identifiables, et traiter son chatbot comme un email non chiffré sont les premiers réflexes à adopter.

Impact France/UE

Le RGPD offre aux utilisateurs européens un droit de suppression des données directement applicable aux plateformes de chatbots, rendant les démarches décrites dans l'article immédiatement actionnables en France et dans l'UE.

💬 L'analyse de Mathieu

On sait tous que c'est risqué, mais on le fait quand même. L'affaire Samsung en 2023 aurait dû servir de signal d'alarme pour tout le monde, pas juste pour les DSI. Ce qui m'intéresse vraiment là-dedans, c'est que le registre conversationnel révèle l'intention, pas juste le contenu, et ça c'est une donnée autrement plus précieuse pour un annonceur ou un assureur. Bonne nouvelle, le RGPD te donne un droit concret d'action, reste à voir combien vont réellement l'utiliser.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Avec son contrôle sur l’information, la Chine biaise les chatbots dans sa langue
1Next INpact 

Avec son contrôle sur l’information, la Chine biaise les chatbots dans sa langue

Une étude publiée dans la revue scientifique Nature, conduite par des chercheurs de plusieurs universités américaines, révèle que la propagande d'État chinois contamine massivement les données d'entraînement des grands modèles de langage occidentaux, y compris les versions les plus récentes de Claude, GPT et Gemini sortis en 2026. Les chercheurs ont analysé CulturaX, un sous-ensemble public et nettoyé de Common Crawl utilisé pour entraîner des modèles dans 167 langues, et ont découvert qu'entre 3,28 % et 23,98 % des textes en chinois mentionnant des dirigeants ou des institutions politiques correspondent à des contenus manipulés par l'État chinois. Concrètement, des modèles comme Claude Opus 4.7, GPT-5.5 et Gemini-3.1-pro mémorisent et reproduisent des formulations issues de la propagande du Parti communiste chinois, et le font d'autant plus qu'ils sont récents et puissants. L'impact est mesurable et documenté : interrogés en mandarin plutôt qu'en anglais, tous les modèles testés produisent des réponses nettement plus alignées avec le discours officiel de Pékin sur des sujets comme Taïwan, le massacre de Tiananmen de 1989 ou Xi Jinping. Ce biais lié à la langue est particulièrement marqué pour Claude Opus 4.6, GPT-5.4, GPT-5.5, Gemini-3.1-pro et Claude Opus 4.7. Les chercheurs ont également vérifié expérimentalement qu'entraîner un modèle sur de la propagande augmente mécaniquement ses réponses pro-autoritaristes, confirmant le lien de causalité. Le cas DeepSeek est notable : le modèle V4 Pro relaie cette propagande même en anglais, ce qui réduit artificiellement son ratio chinois/anglais, sans pour autant signifier qu'il propage moins la vision du régime. Jusqu'ici, le débat sur l'influence de Pékin dans l'IA se concentrait sur les modèles créés par des entreprises chinoises directement soumises au gouvernement, comme DeepSeek lors de son irruption en 2025, avec une censure évidente sur des sujets sensibles. Cette étude déplace le problème : l'influence ne passe plus seulement par les modèles chinois, mais s'infiltre dans les pipelines d'entraînement utilisés par les laboratoires occidentaux eux-mêmes. La Chine produit un volume considérable de contenu numérique en mandarin, et ce contenu, chargé de narratifs officiels, se retrouve aspiré dans les corpus multilingues grand public sans filtre suffisant. La question qui s'ouvre est celle des responsabilités : aux équipes de données des grands labos d'IA d'auditer leurs sources, aux chercheurs de développer des méthodes de détection de propagande à grande échelle, et aux régulateurs de déterminer si un modèle qui relaie des mensonges d'État dans une langue constitue un risque systémique.

UELes modèles déployés par les entreprises et administrations françaises reproduisent des narratifs pro-Pékin en mandarin, ce qui interroge directement les obligations d'audit des données d'entraînement prévues par l'AI Act européen.

💬 Ce qui devrait t'inquiéter, c'est pas DeepSeek, c'est GPT et Claude. Les corpus multilingues publics sont saturés de narratifs pro-Pékin, les labos les aspirent sans filtre sérieux, et les modèles les plus puissants mémorisent d'autant mieux cette propagande. L'audit des données d'entraînement, on en parlait comme d'un détail technique, c'est maintenant un problème politique.

SécuritéOpinion
1 source
L'IA de prise de notes de votre médecin peut inventer des informations, révèle un audit en Ontario
2Ars Technica AI 

L'IA de prise de notes de votre médecin peut inventer des informations, révèle un audit en Ontario

Le bureau de la vérificatrice générale de l'Ontario a publié un rapport alarmant sur l'utilisation des assistants IA de prise de notes médicales dans le système de santé provincial. À l'issue d'une série de tests menés sur 20 fournisseurs de logiciels approuvés et préqualifiés par le gouvernement ontarien pour une utilisation par les professionnels de santé, les auditeurs ont constaté que la totalité de ces outils présentait des problèmes d'exactitude ou d'exhaustivité dans au moins l'un des deux scénarios simulés. Parmi ces 20 solutions, neuf ont inventé des informations sur les patients, douze ont transcrit incorrectement des données médicales, et dix-sept ont omis des éléments essentiels relatifs à des troubles de santé mentale évoqués lors des consultations fictives. Parmi les erreurs documentées figurent des références à des analyses sanguines ou des thérapies qui n'ont jamais été prescrites, des noms de médicaments mal transcrits, et des détails critiques sur l'état psychologique des patients simplement ignorés. Ces résultats ont des implications directes sur la sécurité des patients. Un outil de prise de notes qui hallucine une ordonnance ou omet un antécédent psychiatrique peut induire le médecin suivant en erreur, conduire à des prescriptions inappropriées ou à l'absence de prise en charge adaptée. La vérificatrice générale souligne explicitement que ces défaillances pourraient "potentiellement entraîner des plans de traitement inadéquats ou dangereux, avec un impact réel sur la santé des patients." Le fait que ces outils soient officiellement approuvés par le gouvernement provincial accentue la gravité du constat : les établissements de santé qui les ont acquis l'ont fait en faisant confiance à une validation publique. L'essor des assistants IA de transcription médicale répond à une réalité bien documentée : les médecins consacrent une part croissante de leur temps à la documentation administrative au détriment du soin. Ces outils promettent d'automatiser la rédaction des comptes rendus à partir des échanges oraux en consultation. Mais leur intégration rapide dans des contextes à enjeux élevés s'est faite sans évaluation rigoureuse préalable. Ce rapport ontarien s'inscrit dans un débat plus large sur la fiabilité des modèles de langage dans les environnements médicaux, et interpelle directement les régulateurs sur la nécessité de standards de certification plus stricts avant toute recommandation officielle.

UECet audit interpelle directement les régulateurs européens car l'AI Act classe les outils IA médicaux comme systèmes à haut risque, or des assistants de transcription similaires sont déjà déployés dans les établissements de santé français et européens sans certification équivalente à celle exigée par ce nouveau cadre réglementaire.

💬 20 outils approuvés, 20 outils qui inventent des ordonnances ou oublient des antécédents psychiatriques. Le problème n'est pas l'hallucination (ça, tout le monde le sait), c'est que le tampon gouvernemental ne valait manifestement rien. En Europe, l'AI Act classe ces outils comme systèmes à haut risque, reste à voir si ça débouchera sur des certifications plus sérieuses que celles de l'Ontario.

SécuritéActu
1 source
Encore une méchante fuite, avec injection de prompt dans un chatbot cette fois-ci…
3Next INpact 

Encore une méchante fuite, avec injection de prompt dans un chatbot cette fois-ci…

Une institution française a récemment été victime d'une cyberattaque exploitant une technique d'injection de prompt ciblant le chatbot intégré à son site web, vraisemblablement développé sur WordPress. Les pirates, qui se présentent eux-mêmes comme des « gentils hackers », ont revendiqué l'attaque sur Breachforums, forum de référence des cybercriminels, en détaillant publiquement leur méthode. Plutôt que de publier des échantillons de données volées — pratique habituelle pour prouver un accès — ils ont contacté l'entreprise pour exiger une rançon en échange des informations exfiltrées. L'opération a permis aux attaquants d'obtenir des droits administrateur sur le site cible et de siphonner ses données, dont des correspondances privées d'utilisateurs que les pirates qualifient pudiquement de « victimes collatérales ». Cette attaque illustre concrètement un risque que la communauté sécurité documente depuis des années mais que l'industrie peine à adresser : l'injection de prompt reste l'un des vecteurs d'attaque les plus sous-estimés contre les IA génératives déployées en production. OpenAI elle-même a reconnu que ce type de vulnérabilité constituera « un défi pour de nombreuses années ». Pour les entreprises qui intègrent des chatbots — souvent de simples surcouches de ChatGPT rebadgées — sans audit de sécurité sérieux, le risque est réel et immédiat : prise de contrôle administrative, exfiltration de données clients, chantage. Le modèle économique des chatbots de service client bas de gamme crée une surface d'attaque massive, directement exposée au public. L'injection de prompt est en réalité la réincarnation moderne de l'injection SQL des années 2000 : on manipule les instructions données à un système pour lui faire exécuter des actions non prévues. Les techniques documentées vont des instructions explicites (« ignore toutes les consignes précédentes ») aux contenus cachés dans des images ou du texte invisible. Cette attaque survient dans un contexte de recrudescence des incidents liés aux IA et aux fuites de données en France : début avril 2026 a déjà vu la propagation virale de malwares dans des projets open source via les outils Trivy et LiteLLM, ainsi que la compromission de la bibliothèque JavaScript Axios. S'y ajoutent des fuites sensibles comme celle du fichier SIA du ministère de l'Intérieur — exposant les adresses de détenteurs d'armes — et le cas Florajet, où plus d'un million de messages intimes accompagnant des commandes de fleurs ont été exfiltrés, ouvrant la voie à du chantage ciblé. La multiplication de ces incidents souligne l'urgence d'un encadrement technique plus strict des déploiements IA en contact direct avec les utilisateurs.

UEUne institution française a été compromise via injection de prompt sur son chatbot, avec exfiltration de données et tentative de rançon, illustrant un risque immédiat pour toute organisation française déployant des chatbots en production sans audit de sécurité.

💬 L'injection de prompt, c'est l'injection SQL version 2025, et on le sait depuis que les premiers chatbots en prod sont apparus. Ce qui est nouveau, c'est que maintenant ça arrive en vrai, sur de vraies institutions françaises, avec de vraies données exfiltrées et une vraie demande de rançon. Les "gentils hackers" qui contactent l'entreprise plutôt que de balancer les données, bon, c'est presque touchant, mais ça ne change pas grand-chose à l'affaire : si tu colle un chatbot WordPress en production sans audit sécurité, tu viens d'ouvrir une porte d'entrée admin au premier qui sait taper "ignore toutes les instructions précédentes".

SécuritéOpinion
1 source
L’IA de Google produit « des dizaines de millions d’erreurs chaque heure »
4Frandroid 

L’IA de Google produit « des dizaines de millions d’erreurs chaque heure »

Une enquête du New York Times révèle que les résumés générés automatiquement par Gemini, l'intelligence artificielle de Google, comportent des erreurs dans environ un cas sur dix. À l'échelle des milliards de requêtes traitées chaque jour par le moteur de recherche, ce taux d'échec représente des dizaines de millions d'informations incorrectes diffusées chaque heure auprès des utilisateurs. Ces erreurs peuvent prendre la forme de faits inventés, de dates erronées, de citations tronquées ou de conclusions déformées présentées comme des synthèses fiables. L'enjeu est considérable : contrairement à un lien classique que l'utilisateur peut ignorer ou croiser avec d'autres sources, les résumés IA s'affichent en tête de page dans un format qui inspire confiance et réduit l'incitation à vérifier. Pour des millions de personnes qui se fient désormais à ces encadrés pour obtenir une réponse rapide, chaque erreur peut se transformer en croyance erronée difficilement corrigeable. Les professionnels de santé, juristes, enseignants ou journalistes qui utilisent Google comme outil de travail sont directement exposés. Google a déployé ses résumés IA, baptisés AI Overviews, à grande échelle depuis mai 2024 aux États-Unis, puis progressivement dans le reste du monde, malgré plusieurs incidents embarrassants dès le lancement. La course à l'intégration de l'IA dans les moteurs de recherche, portée aussi par Microsoft Bing et Perplexity, pousse les acteurs à déployer vite plutôt qu'à déployer bien. Cette révélation relance le débat sur la responsabilité des plateformes face à la désinformation algorithmique et sur la nécessité d'une régulation plus stricte de ces fonctionnalités.

UEGoogle AI Overviews étant déployé progressivement en Europe, les utilisateurs français et européens sont exposés à ce flux d'erreurs, renforçant les arguments pour une régulation stricte des résumés IA dans le cadre de l'AI Act.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic