Aller au contenu principal
DataGrail : vos fournisseurs envoient peut-être vos données à des modèles d'IA sans votre accord
ÉthiqueVentureBeat AI1sem

DataGrail : vos fournisseurs envoient peut-être vos données à des modèles d'IA sans votre accord

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

DataGrail, plateforme de protection de la vie privée basée à San Francisco, a publié son Privacy and AI Trends Report 2026 après avoir analysé 2 400 logiciels d'entreprise parmi les plus répandus. Le constat est sévère : 63,6 % des éditeurs qui mettent en avant leurs fonctionnalités d'intelligence artificielle ne mentionnent aucun sous-traitant IA tiers dans leurs contrats de traitement des données (DPA). Ces documents juridiques constituent pourtant la base sur laquelle les équipes juridiques et de conformité évaluent les risques liés à leurs fournisseurs. Pour établir ce chiffre, les chercheurs ne se sont pas contentés de lire les contrats : ils ont croisé les DPA avec la documentation produit, les dépôts GitHub, les connexions API et les supports marketing de chacun des 2 400 éditeurs. Résultat : un DPA peut mentionner Claude comme modèle utilisé, tandis que la documentation technique révèle en parallèle des intégrations avec OpenAI et Gemini, sans que cela soit reflété dans aucun document contractuel.

Les conséquences concrètes de ce décalage sont potentiellement graves. Une entreprise qui adopte un outil de recrutement basé sur l'IA, effectue un audit de sécurité d'Anthropic sur la foi du DPA, et ignore que l'outil transmet en réalité des milliers de CV contenant adresses, données financières et numéros de sécurité sociale à des modèles jamais évalués, s'expose à des violations réglementaires sérieuses, notamment les règles de la FTC sur la prise de décision automatisée en matière d'emploi. Plus largement, selon le rapport IBM 2025 sur le coût des violations de données, les organisations confrontées à du "shadow AI" affichent un coût moyen de violation de 4,63 millions de dollars, soit 670 000 dollars de plus que celles sans IA non déclarée. Aux États-Unis, les amendes liées à la vie privée ont atteint 3,425 milliards de dollars en 2025, davantage que lors des cinq années précédentes réunies, une tendance que Gartner anticipe en accélération jusqu'en 2028.

Ce rapport arrive dans un contexte où l'ensemble de l'industrie logicielle cherche à se repositionner comme acteur de l'IA, souvent plus vite que les processus de gouvernance ne peuvent suivre. Daniel Barber, co-fondateur et PDG de DataGrail, résume la situation : le DPA était censé être le document de référence pour évaluer le risque IA, mais ce n'est plus suffisant en 2026. Le problème structurel tient au fait que les sous-traitants IA se multiplient, changent rapidement, et que les éditeurs ne mettent pas systématiquement à jour leur documentation juridique en conséquence. L'enjeu pour les entreprises est désormais d'aller au-delà de la lecture des contrats et d'auditer activement les connexions techniques réelles de leurs fournisseurs pour savoir précisément quels modèles traitent leurs données et celles de leurs clients.

Impact France/UE

Les entreprises européennes utilisant des SaaS intégrant l'IA s'exposent à des violations du RGPD si leurs fournisseurs sous-traitent des données à des modèles d'IA non déclarés dans les DPA, contournant les obligations de traçabilité et de transparence imposées par le règlement européen.

💬 Le point de vue du dev

63% des éditeurs IA ne mentionnent aucun sous-traitant dans leur DPA, le chiffre est difficile à avaler. Ton outil de recrutement SaaS audité côté Anthropic peut très bien envoyer tes CV à OpenAI et Gemini en parallèle, sans que rien n'apparaisse dans aucun contrat. Le DPA comme unique référence de risque, c'est fini.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Perplexity dans la tourmente : des données personnelles d’utilisateurs auraient fuité vers Meta et Google
1Siècle Digital 

Perplexity dans la tourmente : des données personnelles d’utilisateurs auraient fuité vers Meta et Google

Un utilisateur de l'Utah, qui souhaite conserver l'anonymat, a porté plainte contre Perplexity AI, accusant le moteur de recherche basé sur l'intelligence artificielle d'avoir transmis ses conversations privées à Meta et Google sans son consentement. Selon son avocat, l'utilisateur recourait régulièrement à Perplexity pour obtenir des conseils fiscaux, juridiques et financiers, des échanges qu'il considérait confidentiels. Des outils de tracking intégrés à la plateforme auraient permis à des tiers d'accéder à ces données sensibles, à l'insu des utilisateurs. Cette affaire soulève une question centrale pour l'ensemble du secteur des assistants IA : que deviennent les conversations des utilisateurs lorsqu'ils confient à ces outils des informations personnelles, médicales ou financières ? Contrairement à un moteur de recherche classique où l'on tape des mots-clés, Perplexity incite à formuler des questions détaillées, souvent très révélatrices de la situation personnelle de l'utilisateur. Partager ce type de données avec des régies publicitaires comme Meta ou Google représente une violation grave de la confiance placée dans ces plateformes, avec des implications directes sur la vie privée de millions de personnes. Perplexity, fondée en 2022 et valorisée à plusieurs milliards de dollars, s'est rapidement imposée comme un concurrent sérieux face à Google Search et ChatGPT. La startup avait déjà fait l'objet de critiques pour ses pratiques de scraping agressif et des accusations de plagiat envers des médias. Cette plainte s'inscrit dans un contexte plus large de régulation croissante des pratiques des entreprises d'IA autour de la collecte et du partage de données personnelles, notamment en Europe avec le RGPD et aux États-Unis où plusieurs États renforcent leurs législations sur la vie privée.

UESi des pratiques similaires de partage de conversations avec des régies publicitaires concernaient des utilisateurs européens, elles constitueraient une violation caractérisée du RGPD, exposant Perplexity à des sanctions pouvant atteindre 4 % de son chiffre d'affaires mondial.

💬 Perplexity, c'est le genre de produit qu'on conseille à ses proches parce que "c'est mieux que Google" — sauf qu'on vient de découvrir que des conversations sur ses impôts ou sa situation juridique partaient peut-être chez Meta. Le problème, c'est que les gens posent des vraies questions à ces outils, pas des mots-clés détachés de tout contexte, et la différence est énorme côté données. Faut arrêter de traiter les assistants IA comme des moteurs de recherche glorifiés : dès qu'on y colle du contexte personnel, c'est une autre catégorie de risque.

ÉthiqueActu
1 source
« AI Sponsored Snaps » : Faîtes gaffe, votre « ami » IA sur Snapchat est peut-être un vendeur
2Le Big Data 

« AI Sponsored Snaps » : Faîtes gaffe, votre « ami » IA sur Snapchat est peut-être un vendeur

Snapchat a lancé une nouvelle fonctionnalité publicitaire baptisée "AI Sponsored Snaps", qui introduit des agents conversationnels financés par des marques directement dans les discussions des utilisateurs. Concrètement, ces robots IA s'insèrent dans la messagerie et répondent aux questions comme n'importe quel interlocuteur, mais avec pour mission sous-jacente de guider les échanges vers des produits ou services commerciaux. Experian est le premier partenaire officiel : son agent commence par aborder des sujets financiers généraux avant d'orienter progressivement la conversation vers ses offres. Ce lancement intervient dans un contexte de croissance massive de l'usage de la messagerie sur la plateforme : 85 % des utilisateurs de Snapchat s'en servent régulièrement, et plus de 950 milliards de messages ont été envoyés au premier trimestre 2026 seulement. Cette initiative marque un tournant dans la façon dont la publicité s'infiltre dans les espaces numériques intimes. Contrairement à une bannière ou une vidéo sponsorisée clairement identifiable, les AI Sponsored Snaps se comportent comme de vrais interlocuteurs, rendant la frontière entre conversation et démarchage commercial particulièrement floue. Ajit Mohan, directeur commercial de Snapchat, résume la philosophie du projet en ces termes : "La conversation devient le bien immobilier le plus précieux en publicité." Pour les utilisateurs, l'intérêt reste difficile à cerner : les réponses fournies ne diffèrent pas fondamentalement de celles d'un assistant classique comme Gemini ou Claude, à la différence près que chaque échange est pensé pour générer des revenus aux marques partenaires. C'est la promesse d'un service, mais au profit du commanditaire. Snapchat s'appuie pour cela sur le bilan de My AI, son assistant conversationnel lancé en 2023, qui aurait été utilisé par plus de 500 millions de personnes depuis son déploiement. Ce socle d'adoption massif offre à la plateforme un terrain d'expérimentation publicitaire sans précédent dans la messagerie sociale. Mais le parcours n'a pas été sans accrocs : lors de tests menés par des journalistes et des chercheurs simulant des profils d'adolescents, My AI avait déjà fourni des réponses jugées inappropriées sur des sujets sensibles, soulevant des questions sur la modération et la protection des mineurs. Avec les AI Sponsored Snaps, ces enjeux se doublent d'une dimension commerciale qui risque d'amplifier les critiques. Le modèle que Snapchat est en train de construire, où l'IA sert autant de vendeur que d'assistant, pourrait bien devenir une référence pour d'autres plateformes cherchant à monétiser leurs espaces de conversation.

UEL'AI Act européen impose des obligations de transparence qui pourraient contraindre Snapchat à identifier explicitement ces agents comme outils commerciaux auprès des utilisateurs européens, et la CNIL pourrait examiner la collecte de données conversationnelles à des fins publicitaires.

ÉthiqueOpinion
1 source
Amnesty appelle à interdire les IA génératives entraînées sur du pillage de données
3Next INpact 

Amnesty appelle à interdire les IA génératives entraînées sur du pillage de données

Amnesty International a publié un rapport détaillé sur les violations des droits humains causées par l'intelligence artificielle générative, appelant explicitement à interdire les modèles entraînés sur du scraping de données non consenti. L'organisation analyse l'ensemble de la chaîne de production de l'IA, des fabricants de puces GPU jusqu'aux contenus générés, en passant par la constitution des jeux de données. Elle cible directement les outils grand public les plus utilisés : ChatGPT, DALL-E, Gemini, Midjourney, LLaMA, Stable Diffusion et DeepSeek. Selon Amnesty, ces modèles ont été construits à partir de données collectées "sans la connaissance ni le consentement des personnes à l'origine des données", qu'il s'agisse d'utilisateurs de réseaux sociaux ou d'artistes. La conclusion est sans appel : le scraping massif et non consenti est "fondamentalement incompatible avec le droit international relatif aux droits humains", notamment le Pacte international relatif aux droits civils et politiques adopté par l'ONU en 1966. L'impact dépasse la seule question de la vie privée. Amnesty identifie des violations du droit à la non-discrimination, à la liberté d'expression et à la liberté de pensée. Le rapport pointe également les coûts environnementaux de l'IA générative, dont l'augmentation continue de la taille des modèles et des volumes de données nécessaires à leur entraînement affecte de manière disproportionnée les pays du Sud global. À cela s'ajoute une domination culturelle et linguistique anglophone structurelle, intégrée dès la phase de collecte des données. Pour l'ONG, derrière l'apparence de sophistication technologique se cache "une réalité faite de principes de conception qui bafouent les droits humains", comparables aux dérives des outils d'IA antérieurs à la générative. Ce rapport s'inscrit dans un mouvement plus large de contestation juridique et institutionnelle du modèle économique des grandes plateformes d'IA. En Europe, l'organisation noyb a déjà menacé Meta d'une class action pour l'entraînement de ses modèles sur des données d'utilisateurs européens, et plusieurs artistes ainsi que des éditeurs de presse ont engagé des procédures similaires aux États-Unis contre OpenAI et Google. Le règlement européen sur l'IA impose des obligations de transparence sur les données d'entraînement, mais les ONG estiment ces mesures insuffisantes. En demandant une interdiction pure et simple des systèmes bâtis sur du scraping non consenti, Amnesty franchit un cap rhétorique notable : il ne s'agit plus de réguler ces pratiques, mais de les proscrire au nom du droit international, ce qui pourrait alimenter de nouvelles stratégies judiciaires et législatives dans les mois à venir.

UEL'AI Act impose déjà des obligations de transparence sur les données d'entraînement, et noyb menace Meta d'une class action pour l'exploitation des données d'utilisateurs européens, la position d'Amnesty pourrait renforcer ces procédures et peser sur les stratégies législatives et judiciaires dans l'UE dans les mois à venir.

💬 La position d'Amnesty est radicale, et c'est exactement là son intérêt : plus de régulation molle, on interdit ce qui viole les droits humains, point. Interdire ChatGPT et Gemini du jour au lendemain c'est pas pour demain, mais ancrer ce débat dans le droit international plutôt que dans la soft law de l'AI Act, c'est un changement de registre qui peut nourrir des procédures vraiment musclées. Reste à voir si les juges suivront.

ÉthiqueReglementation
1 source
Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare
4Next INpact 

Chrome peut stocker 4 Go associés à Gemini sur votre machine sans crier gare

Des utilisateurs de Google Chrome ont découvert sur leurs machines un fichier baptisé weights.bin, pesant jusqu'à 4 gigaoctets, téléchargé sans la moindre notification ni demande de consentement. Ce fichier est stocké dans un dossier nommé OptGuideOnDeviceModel, accessible sous Windows dans AppData\Local\Google\Chrome\User Data\Default\ et sous macOS dans ~/Library/Application Support/Google/Chrome/Default/. Les premiers signalements remontent à mi-2025, mais le sujet a resurgi le 4 mai 2026 avec la publication d'une analyse détaillée par Alexander Hanff, consultant en sécurité connu sous le pseudonyme ThatPrivacyGuy. Selon ses observations, Chrome télécharge ce fichier dans les quinze minutes suivant l'ouverture du navigateur, et le recrée automatiquement à chaque lancement s'il a été supprimé manuellement. Le phénomène n'est pas universel : les auteurs de l'article source n'ont trouvé aucune trace du fichier sur quatre machines testées sous Windows et macOS. L'absence totale d'information de la part de Google constitue le cœur du problème. Occuper 4 gigaoctets sur le disque d'un utilisateur sans explication ni possibilité simple de refus représente une atteinte directe à la maîtrise que chacun devrait avoir sur son propre matériel. Alexander Hanff va plus loin : il estime que ce comportement contrevient à la directive européenne e-Privacy de 2002, qui encadre précisément les accès aux ressources des terminaux des utilisateurs. Il réclame de Google une communication claire sur la nature du fichier, l'adoption d'un mécanisme d'opt-in exigeant un consentement préalable, et la possibilité de supprimer définitivement ce contenu. L'impact n'est pas seulement individuel : le consultant tente également d'évaluer l'empreinte environnementale de ces téléchargements répétés sur des centaines de millions d'appareils, même si ce calcul reste hautement spéculatif. Ce fichier n'est pourtant pas totalement opaque sur le plan technique. Il correspond à l'intégration de Gemini Nano, le modèle d'intelligence artificielle embarqué de Google, directement dans Chrome, une démarche documentée publiquement depuis fin 2024. Ces poids de modèle servent à alimenter des fonctionnalités comme la détection automatique de langue ou d'autres outils d'IA locale dans le navigateur. Google n'a pas encore réagi publiquement à la controverse. L'affaire s'inscrit dans un contexte plus large de déploiement silencieux de fonctions d'IA par les grands éditeurs : Alexander Hanff avait récemment épinglé Claude Desktop d'Anthropic pour un comportement similaire, pré-autorisant ses extensions de navigateur sans en informer l'utilisateur. La pression réglementaire européenne et la sensibilité croissante du public sur la souveraineté numérique rendent ce type de pratique de plus en plus difficile à maintenir sans déclencher de réaction.

UELe comportement de Chrome pourrait enfreindre la directive e-Privacy européenne de 2002, exposant Google à des recours réglementaires pour dépôt de fichiers sur les terminaux d'utilisateurs européens sans consentement préalable.

💬 4 Go sans demander, n'importe quelle startup se ferait retourner pour ça. Le fichier en lui-même n'est pas mystérieux, c'est Gemini Nano, documenté depuis fin 2024, mais déposer ça silencieusement sur des centaines de millions de machines sans opt-in, ça ne tient pas face à l'e-Privacy. Reste à voir ce que ça va coûter à Google au niveau réglementaire.

ÉthiqueReglementation
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour