Aller au contenu principal
Meta accusée d’avoir piraté des millions de livres pour entraîner son IA
ÉthiqueSiècle Digital6sem· 1 min de lecture

Meta accusée d’avoir piraté des millions de livres pour entraîner son IA

Source originale ↗·

Cinq géants de l'édition mondiale, Hachette, Macmillan, McGraw-Hill, Elsevier et Cengage, ont déposé une plainte collective contre Meta devant un tribunal fédéral américain, accusant l'entreprise d'avoir utilisé des millions d'ouvrages protégés par le droit d'auteur pour entraîner ses modèles d'intelligence artificielle LLaMA. L'auteur de thrillers Scott Turow, ancien président de l'Authors Guild et avocat de formation, s'est joint à l'action. Selon les plaignants, Meta aurait eu recours à LibGen, un site pirate qui héberge illégalement des millions de livres, pour constituer son corpus d'entraînement à grande échelle, sans autorisation ni compensation.

Ce procès marque un tournant dans les litiges sur le droit d'auteur et l'IA : pour la première fois, ce ne sont plus des auteurs isolés mais des maisons d'édition pesant collectivement des milliards de dollars qui s'attaquent frontalement à un géant technologique. Si les plaignants obtiennent gain de cause, les dommages et intérêts pourraient atteindre des montants records et contraindre l'ensemble de l'industrie à revoir radicalement ses pratiques d'acquisition de données d'entraînement.

Cette affaire s'inscrit dans un contexte de tensions croissantes entre l'industrie de l'IA et les ayants droit, après les poursuites déjà engagées contre OpenAI, Stability AI et Google. Des preuves internes évoquées dans d'autres dossiers suggèrent que Meta était consciente des risques juridiques liés à l'utilisation de LibGen mais a néanmoins choisi de procéder. La décision de justice pourrait établir une jurisprudence déterminante sur ce que les entreprises d'IA ont le droit d'utiliser pour former leurs modèles.

Impact France/UE

Hachette et Elsevier, maisons d'édition présentes en Europe, sont plaignantes ; une jurisprudence américaine sur l'entraînement des LLM influencera directement les pratiques des acteurs IA opérant sous l'AI Act et les litiges en cours devant les tribunaux européens.

💬 L'analyse de Mathieu

Des auteurs isolés, ça pouvait encore se gérer. Là, ce sont des éditeurs pesant des milliards qui ont les reins solides pour tenir un procès pendant dix ans, et des preuves internes qui montrent que Meta savait très bien ce qu'elle faisait en utilisant LibGen. Ça va coûter cher.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA
1The Verge 

Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA

Meta installe en ce moment un outil de surveillance sur les ordinateurs de ses employés basés aux États-Unis, selon une information révélée par Reuters. L'outil, baptisé Model Capability Initiative (MCI), tourne en arrière-plan dans les applications et sites web liés au travail et enregistre les mouvements de souris, les clics, les frappes au clavier ainsi que des captures d'écran ponctuelles. L'objectif affiché par l'entreprise est d'utiliser ces données comportementales pour entraîner ses modèles d'intelligence artificielle à interagir avec les ordinateurs de la même façon que le font les humains au quotidien. Meta précise que les données collectées ne seront pas utilisées à des fins d'évaluation des performances des salariés. Cette initiative s'inscrit dans la course aux agents IA capables d'automatiser des tâches informatiques complexes, remplir des formulaires, naviguer dans des interfaces, exécuter des workflows bureautiques. En capturant directement les gestes réels de travailleurs qualifiés, Meta cherche à constituer un jeu de données d'entraînement à haute valeur, bien plus représentatif que des données synthétiques. Pour les employés concernés, cela soulève des questions concrètes sur la frontière entre contribution au produit et surveillance au travail. La démarche rappelle celle d'autres géants tech qui collectent des données humaines pour affiner leurs systèmes d'automatisation, comme Google ou Microsoft avec leurs outils Copilot. Meta, qui développe activement ses propres agents IA sous l'impulsion de Mark Zuckerberg, considère visiblement ses équipes internes comme un terrain d'entraînement privilégié. Le fait que le programme soit pour l'instant limité aux États-Unis suggère des contraintes légales en Europe, où le RGPD encadre strictement ce type de collecte en milieu professionnel.

UELe RGPD protège directement les salariés européens de Meta contre ce type de surveillance systématique, ce qui explique que le programme soit pour l'instant limité aux États-Unis et soulève des questions sur la conformité des pratiques de collecte de données en milieu professionnel au sein de l'UE.

ÉthiqueActu
1 source
Meta transforme ses salariés en « rats de laboratoire » pour son futur agent IA
2Le Big Data 

Meta transforme ses salariés en « rats de laboratoire » pour son futur agent IA

Meta surveille les habitudes informatiques de ses employés pour entraîner son futur agent IA. Selon des notes internes révélées par Reuters, l'entreprise a déployé un logiciel de suivi intégré à certains outils professionnels internes, capable d'enregistrer les mouvements de souris, les clics, les frappes clavier et de capturer régulièrement des captures d'écran. Ces données sont collectées sur des applications internes et des sites web professionnels, avec pour objectif de documenter précisément comment les humains interagissent avec leur machine au quotidien. Un porte-parole de Meta confirme que ces informations servent à améliorer la capacité des agents IA à réaliser des tâches concrètes : naviguer dans des menus, cliquer sur des boutons, reproduire des séquences d'actions basiques mais essentielles. L'entreprise assure également que ces données ne seront pas utilisées pour évaluer la performance individuelle des salariés. L'enjeu est considérable pour le développement des agents IA dits "computer use", capables d'opérer directement sur un ordinateur comme le ferait un humain. Les textes, images et vidéos disponibles sur internet sont déjà massivement exploités pour entraîner les grands modèles de langage, mais les données d'interaction réelle avec une interface restent rares et difficiles à obtenir à grande échelle. Des entreprises concurrentes ont recours à des environnements simulés pour générer ce type de données comportementales, une approche coûteuse et imparfaite. En mobilisant directement ses propres employés, Meta accède à des flux de comportements authentiques, dans des contextes de travail réels, ce qui représente un avantage compétitif significatif pour entraîner des agents performants sur des tâches professionnelles. Cette initiative s'inscrit dans un contexte de pression croissante chez Meta autour de l'IA. L'entreprise, qui a massivement investi dans le développement de ses modèles Llama et de ses agents conversationnels, cherche à combler son retard sur des acteurs comme OpenAI ou Google dans le domaine des agents autonomes. En parallèle, Reuters rapporte que Meta envisage de fixer des objectifs d'usage de l'IA à certains de ses personnels, et réfléchirait à une réduction potentielle de ses effectifs mondiaux pouvant atteindre 10 %. La collecte de données sur les employés soulève néanmoins des questions éthiques sur le consentement et la surveillance au travail, même si Meta la présente comme une contribution collective au progrès technologique interne. La frontière entre outil d'entraînement et surveillance professionnelle reste floue, et cette démarche pourrait alimenter les débats réglementaires sur les droits des travailleurs à l'ère de l'IA.

UELe RGPD encadre strictement la surveillance des salariés en Europe, rendant une pratique similaire juridiquement risquée pour toute entreprise opérant dans l'UE, et pourrait accélérer les débats législatifs sur les droits des travailleurs face à l'IA générative.

ÉthiqueActu
1 source
☕️ Meta promet des discussions « vraiment privées » avec son IA
3Next INpact 

☕️ Meta promet des discussions « vraiment privées » avec son IA

Meta a lancé une fonctionnalité appelée "Discussion Incognito" pour son assistant Meta AI, disponible dans WhatsApp et dans l'application dédiée Meta AI. Annoncée en mai 2026, cette option permet de discuter avec l'assistant dans un environnement dit sécurisé, basé sur la technologie maison de traitement privé des requêtes développée l'an dernier. Concrètement, les conversations ne sont pas enregistrées sur les serveurs de Meta, et elles sont supprimées à la fin de chaque session. Mark Zuckerberg a déclaré qu'il s'agissait du "premier grand produit d'IA pour lequel aucune trace de vos conversations n'est stockée sur des serveurs". Meta précise également que, contrairement à d'autres plateformes concurrentes, les questions et réponses ne sont pas accessibles à des tiers : le chat temporaire de ChatGPT conserve les données jusqu'à 30 jours, et celui de Gemini jusqu'à 72 heures. Cette initiative répond à un besoin réel : de nombreux utilisateurs posent à leurs assistants IA des questions très personnelles, touchant à leur santé, leurs finances ou leur vie privée. OpenAI avait lui-même révélé lors de la présentation de ChatGPT Health que les questions médicales figuraient parmi les usages les plus fréquents de son assistant. Dans ce contexte, la promesse d'une confidentialité totale devient un argument commercial fort, en particulier pour Meta, dont le modèle économique repose quasi exclusivement sur la collecte de données personnelles à des fins publicitaires. Proposer un espace d'échange véritablement privé représente donc une rupture symbolique notable avec l'image habituelle de l'entreprise. La décision n'est pas sans ironie. Le 8 mai, Meta a discrètement supprimé le chiffrement de bout en bout sur Instagram, justifiant ce recul par la complexité d'utilisation et la très faible adoption de la fonctionnalité. Autrement dit, la protection maximale des échanges entre humains a été abandonnée au motif qu'elle était peu pratique, tandis qu'elle devient un argument de vente pour les conversations avec une IA. Cette asymétrie soulève des questions sur les priorités réelles de l'entreprise en matière de vie privée. La technologie sous-jacente, documentée dans un livre blanc public, empêche théoriquement même Meta d'accéder au contenu des échanges, ce qui représente une contrainte technique significative pour un groupe habitué à monétiser chaque donnée utilisateur. La concurrence entre les grandes plateformes sur la confidentialité de leurs IA s'annonce comme un terrain de bataille croissant, à mesure que ces outils pénètrent les usages les plus intimes du quotidien.

UEWhatsApp étant l'application de messagerie dominante en France et en Europe, cette fonctionnalité touche directement des millions d'utilisateurs européens qui partagent des données sensibles avec Meta AI, dans un contexte de vigilance accrue autour du RGPD.

ÉthiqueOpinion
1 source
☕️ Meta promet des discussions « vraiment privées » avec son IA
4Next INpact 

☕️ Meta promet des discussions « vraiment privées » avec son IA

Meta a annoncé le lancement d'un mode "Discussion Incognito" pour son assistant Meta AI, disponible sur WhatsApp et dans l'application dédiée Meta AI. Cette fonctionnalité s'appuie sur la technologie maison de traitement privé des requêtes, déployée l'an dernier, qui empêche toute interception des échanges, y compris par Meta elle-même. Les conversations sont traitées dans un environnement sécurisé, ne sont pas enregistrées sur les serveurs de l'entreprise et disparaissent dès la fin de la session. Mark Zuckerberg n'a pas hésité à se montrer conquis par l'initiative : "Il s'agit du premier grand produit d'IA pour lequel aucune trace de vos conversations n'est stockée sur des serveurs." À titre de comparaison, le mode temporaire de ChatGPT conserve les échanges jusqu'à 30 jours, et Google Gemini jusqu'à 72 heures. Cet engagement sur la confidentialité répond à un besoin réel, documenté : les utilisateurs d'assistants IA posent régulièrement des questions très personnelles sur leur santé, leurs finances ou leur vie privée. OpenAI avait ainsi révélé lors de la présentation de ChatGPT Health que la santé figurait parmi les usages les plus fréquents de son assistant. Offrir un espace de discussion sans traçabilité change concrètement le rapport de confiance entre l'utilisateur et la plateforme, en particulier pour des interactions que l'on ne souhaite pas voir monétisées ou exploitées à des fins publicitaires. La décision de Meta est d'autant plus notable qu'elle intervient dans un contexte pour le moins paradoxal : le 8 mai, la société a supprimé le chiffrement de bout en bout des messageries Instagram, au motif que la fonctionnalité était trop peu utilisée et trop complexe. Ce choix illustre une tension de fond chez Meta, dont le modèle économique repose quasi exclusivement sur la publicité ciblée. En renforçant la confidentialité de son IA tout en retirant une protection des communications humaines, l'entreprise semble vouloir rassurer les utilisateurs sur ses ambitions dans l'IA générative, un terrain où la confiance est devenue un argument concurrentiel à part entière. Meta prend soin de souligner, non sans malice, que d'autres applications proposant des fonctions similaires restent en mesure de consulter les questions posées et les réponses reçues, ciblant implicitement ses concurrents OpenAI et Google.

UELe mode incognito sur WhatsApp répond directement aux exigences du RGPD et aux attentes des utilisateurs européens soucieux de confidentialité, dans un contexte où la CNIL et les régulateurs de l'UE examinent de plus en plus les pratiques de collecte de données des assistants IA.

💬 Meta enlève le chiffrement de bout en bout sur Instagram le 8 mai, et cinq jours après annonce que son IA sera "vraiment privée". Le grand écart. La techno derrière semble sérieuse (enclaves sécurisées, zéro trace serveur), mais le timing dit tout sur les motivations.

ÉthiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic