Aller au contenu principal
Meta espère qu'une décision de la Cour suprême sur le piratage l'aidera à faire rejeter le procès sur ses données d'entraînement
RégulationArs Technica AI12sem· 1 min de lecture

Meta espère qu'une décision de la Cour suprême sur le piratage l'aidera à faire rejeter le procès sur ses données d'entraînement

Source originale ↗·

Meta a déposé la semaine dernière une déclaration dans un procès intenté par Entrepreneur Media, espérant s'appuyer sur une récente décision de la Cour suprême américaine pour échapper à sa responsabilité dans une affaire de téléchargement illicite de données d'entraînement pour l'IA. Les plaignants accusent Meta d'avoir utilisé BitTorrent pour télécharger environ 80 téraoctets d'œuvres protégées par le droit d'auteur. En « seedant » ces fichiers — c'est-à-dire en permettant à d'autres utilisateurs de télécharger à partir de ses propres copies — Meta aurait sciemment facilité des infractions supplémentaires au droit d'auteur, ce qui constitue le cœur de la plainte pour « contributory infringement », ou contrefaçon par complicité.

La décision de la Cour suprême que Meta invoque avait établi que les fournisseurs d'accès à Internet ne sont pas responsables des actes de piratage commis sur leurs réseaux par leurs abonnés. Meta tente d'appliquer ce raisonnement à sa propre situation, arguant qu'une simple connaissance du fonctionnement du protocole BitTorrent ne suffit pas à établir une responsabilité juridique. L'enjeu est considérable : la plainte en contrefaçon par complicité est nettement plus facile à prouver qu'une accusation de contrefaçon directe, car elle n'exige pas de démontrer que Meta a téléchargé une œuvre dans son intégralité — seulement qu'elle a facilité des transferts de fichiers.

Cette affaire s'inscrit dans un contentieux plus large autour de l'entraînement des grands modèles de langage sur des données potentiellement protégées. Une action collective distincte, Kadrey v. Meta, portée par des auteurs, poursuit Meta pour contrefaçon directe liée au même épisode de torrent. L'ensemble de ces procédures reflète une bataille juridique fondamentale qui oppose l'industrie de l'IA aux ayants droit : dans quelle mesure les entreprises technologiques peuvent-elles aspirer massivement du contenu protégé pour entraîner leurs modèles sans s'exposer à des poursuites ? La façon dont les tribunaux américains répondront à cette question façonnera durablement les pratiques de collecte de données dans tout le secteur.

Impact France/UE

La jurisprudence américaine sur les données d'entraînement pourrait influencer l'interprétation du cadre européen sur les droits d'auteur face à l'IA, notamment dans les procédures similaires en cours en Europe sous l'AI Act.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté
1Next INpact 

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Meta fait face à une procédure judiciaire initiée à l'été 2025 par deux entreprises américaines de production et distribution de films pornographiques, Strike 3 Holdings et Counterlife Media. Ces sociétés accusent le géant des réseaux sociaux d'avoir téléchargé illégalement 2 396 films via le protocole BitTorrent pour entraîner Llama, son grand modèle de langage. Le 11 juin 2026, la juge Eumi K. Lee a refusé de rejeter la plainte, estimant que les éléments présentés par les plaignants étaient suffisamment solides pour justifier la poursuite de la procédure et l'ouverture d'une phase d'enquête approfondie. La magistrate a également précisé que les plaignants n'avaient pas à démontrer que leurs films avaient effectivement servi à l'entraînement du modèle : le simple fait d'avoir téléchargé et distribué ces contenus via BitTorrent sans autorisation constitue déjà une violation du droit d'auteur. Cette décision établit un précédent important dans les batailles juridiques qui opposent l'industrie créative aux grandes entreprises d'IA. En dissociant l'infraction au droit d'auteur de l'usage ultérieur des données, la juge ouvre la voie à des poursuites plus faciles à engager contre les acteurs qui ont massivement aspiré du contenu en ligne pour construire leurs modèles. Pour Meta, le risque est non seulement financier, Strike 3 est connu pour ses milliers de poursuites et sa réputation de "troll des droits d'auteur", mais aussi réputationnel, dans un contexte où la question du consentement des créateurs de contenu est au cœur du débat sur l'IA générative. L'entreprise a tenté de se défendre en arguant que l'adresse IP retrouvée ne prouve pas que c'est Meta en tant qu'organisation qui a procédé aux téléchargements, suggérant que des employés, sous-traitants ou visiteurs auraient pu agir à titre personnel. Le dossier s'inscrit dans un contexte plus large où Meta a déjà reconnu avoir utilisé BitTorrent pour récupérer la bibliothèque clandestine LibGen et alimenter ses modèles Llama, ce que la juge a pris en compte pour évaluer la crédibilité des nouvelles accusations. Cette affaire illustre la pratique répandue dans le secteur consistant à collecter massivement des données accessibles en ligne sans le consentement de leurs auteurs. La prochaine étape verra Meta tenter de démontrer que ces téléchargements BitTorrent n'étaient pas liés à ses projets d'intelligence artificielle, tandis que les plaignants s'efforceront d'établir un lien direct entre les fichiers récupérés et les systèmes d'entraînement des modèles. L'issue de cette procédure pourrait influencer durablement les pratiques de collecte de données dans toute l'industrie de l'IA.

UECe précédent judiciaire américain pourrait influencer les débats européens sur la légalité de la collecte de données d'entraînement, alors que l'UE élabore sa propre jurisprudence sur le droit d'auteur appliqué à l'IA générative.

💬 La décision qui compte ici, c'est pas l'affaire porno en soi, c'est ce que la juge a posé comme principe : télécharger sans autorisation suffit à constituer une infraction, que les données aient servi à l'entraînement ou pas. Tous les acteurs qui ont aspiré du contenu via BitTorrent en mode "on verra bien plus tard" se retrouvent exposés, Meta en tête vu qu'ils avaient déjà avoué pour LibGen. C'est ce précédent-là qui va faire mal, pas l'angle "film porno" qui fait sourire mais détourne l'attention.

RégulationReglementation
1 source
Le Pentagone fait appel de la décision suspendant la mise sur liste noire d'Anthropic
2The Information AI 

Le Pentagone fait appel de la décision suspendant la mise sur liste noire d'Anthropic

Le Pentagone a fait appel jeudi d'une décision de justice qui suspendait provisoirement sa désignation d'Anthropic comme risque pour la chaîne d'approvisionnement. La juge fédérale Rita Lin avait accordé la semaine précédente une injonction préliminaire en faveur d'Anthropic, assortie d'un délai administratif de sept jours laissant au Département de la Défense le temps de porter l'affaire devant une juridiction supérieure. Cet appel était largement anticipé. L'enjeu est considérable pour Anthropic : une désignation officielle comme risque pour la chaîne d'approvisionnement par le Pentagone pourrait exclure la startup de nombreux contrats fédéraux et freiner ses ambitions sur le marché gouvernemental américain, un secteur en pleine expansion pour les fournisseurs d'IA. Cette classification affecterait également la réputation commerciale de l'entreprise auprès d'autres clients institutionnels. Cette affaire s'inscrit dans un contexte de tensions croissantes entre l'administration américaine et certains acteurs de l'IA, dans un moment où Washington cherche à encadrer ses dépendances technologiques stratégiques. Anthropic, fondé en 2021 par d'anciens cadres d'OpenAI et valorisé à plusieurs dizaines de milliards de dollars, se retrouve ainsi au coeur d'un bras de fer juridique et politique qui illustre les enjeux géopolitiques entourant désormais le développement de l'intelligence artificielle.

RégulationReglementation
1 source
Le PDG d'Anthropic réclame une réglementation de l'IA inspirée de la FAA : ce que les entreprises doivent savoir
3VentureBeat AI 

Le PDG d'Anthropic réclame une réglementation de l'IA inspirée de la FAA : ce que les entreprises doivent savoir

Dario Amodei, cofondateur et PDG d'Anthropic, a publié un essai intitulé "Policy on the AI Exponential" dans lequel il appelle le gouvernement américain à réguler la mise sur le marché des modèles d'IA les plus puissants, en s'inspirant explicitement de la Federal Aviation Administration (FAA). Anthropic a simultanément dévoilé deux feuilles de route : un "Advanced AI Framework" ciblant les risques catastrophiques, et un "Economic Policy Framework" sur les déplacements d'emplois liés à l'IA, doté de 350 millions de dollars. Ces annonces surviennent le lendemain du lancement de Claude Fable 5, le modèle grand public le plus puissant de l'entreprise, et de Claude Mythos 5, une version plus restreinte aux capacités offensives et défensives avancées en cybersécurité. Concrètement, le cadre proposé exigerait que tout modèle entraîné avec plus de 10^25 opérations flottantes (FLOPs), ou développé par une entreprise dépassant 500 millions de dollars de revenus IA ou 1 milliard en R&D, soit soumis à des audits obligatoires par des tiers indépendants. En cas de risques biologiques, cybernétiques ou d'autonomie graves, les autorités auraient le pouvoir de bloquer, retarder ou révoquer le déploiement de ces modèles. Pour les entreprises qui s'appuient sur des API d'IA dans leur infrastructure, les conséquences sont immédiates : une mise à jour très attendue pourrait être indéfiniment bloquée par des régulateurs, ou un modèle déjà déployé retiré si des tests post-déploiement révèlent des comportements dangereux. Cela contraint les architectes techniques à concevoir des systèmes multi-modèles pour éviter toute dépendance exclusive à un fournisseur unique. La cybersécurité est au coeur du dispositif : Amodei cite directement les capacités de Claude Mythos Preview, capable de découvrir des vulnérabilités critiques dans les principaux systèmes d'exploitation, comme facteur ayant "bouleversé" le paysage mondial de la sécurité informatique. Les développeurs frontières seraient tenus de protéger les poids de leurs modèles contre les attaques extérieures et les menaces internes, et de signaler les "attaques par distillation", où des acteurs malveillants utilisent un modèle principal pour entraîner un clone moins aligné. Cette prise de position marque un tournant pour Anthropic, longtemps positionné comme champion de la sécurité de l'IA face à OpenAI et Google DeepMind. Pendant trois ans, les entreprises ont construit leurs produits sur l'hypothèse que les API d'IA n'évolueraient que vers plus de puissance. L'introduction d'embargos réglementaires potentiels bouleverse ce postulat. "Nous avons longtemps plaidé pour des exigences de transparence sur l'IA frontière, parce que les risques n'étaient pas encore assez clairs pour être précisément régulés. Ce n'est plus suffisant", a écrit Amodei sur X. Avec ces propositions, Anthropic cherche à façonner le cadre législatif avant que d'autres acteurs, notamment au Congrès américain, ne le définissent à sa place, tout en consolidant sa légitimité auprès des régulateurs et des grandes entreprises clientes.

UESi ce cadre réglementaire américain est adopté, les entreprises européennes dépendant d'API de modèles frontières pourraient subir des interruptions de service imprévues en cas de blocage ou retrait d'un modèle par les autorités américaines.

💬 Lancer Fable 5 la veille de l'essai sur la régulation, c'est du lobbying bien habillé, et personne n'est dupe. Sur le fond, les audits tiers pour les modèles frontières ça a du sens, c'est même ce qu'on attendait depuis un moment. Ce qui change vraiment pour ceux qui construisent sur ces API, c'est la clause retrait post-déploiement : ton modèle en prod peut être coupé du jour au lendemain par des régulateurs, donc le multi-fournisseur passe d'option à urgence.

RégulationReglementation
1 source
GitHub fait machine arrière et va bien entraîner ses IA sur vos données
4Numerama 

GitHub fait machine arrière et va bien entraîner ses IA sur vos données

GitHub a officiellement annoncé qu'il utilisera les données de ses utilisateurs pour entraîner ses modèles d'intelligence artificielle, dont Copilot. Ce revirement marque un changement de position notable pour la plateforme de Microsoft, qui avait jusqu'ici laissé planer une certaine ambiguïté sur l'usage réel de ces données. Désormais, la participation à l'entraînement des IA est confirmée, sous réserve de conditions précises que GitHub n'a pas encore détaillées publiquement dans leur intégralité. Ce changement concerne potentiellement des dizaines de millions de développeurs qui hébergent leur code sur GitHub — la plus grande plateforme de dépôts au monde avec plus de 100 millions d'utilisateurs. Le fait que du code source, des commentaires et des contributions soient réinjectés dans l'entraînement de Copilot soulève des questions directes sur la propriété intellectuelle, la confidentialité du code propriétaire, et la transparence des consentements. Pour les entreprises qui utilisent GitHub en supposant que leur code interne reste privé, les implications pratiques peuvent être significatives. Cette décision s'inscrit dans une tendance plus large de l'industrie tech à monétiser les données des utilisateurs pour alimenter leurs produits d'IA générative. Microsoft, qui a racheté GitHub en 2018 pour 7,5 milliards de dollars, investit massivement dans l'IA via son partenariat stratégique avec OpenAI. La question des droits sur les données d'entraînement fait l'objet de litiges actifs dans plusieurs pays, et ce positionnement de GitHub pourrait alimenter de nouvelles contestations légales ou réglementaires, notamment en Europe où le RGPD encadre strictement ce type d'usage.

UELe RGPD impose à GitHub/Microsoft d'obtenir un consentement valide des développeurs européens avant d'utiliser leur code pour entraîner Copilot, exposant la plateforme à des contrôles de la CNIL et à d'éventuels recours juridiques en Europe.

💬 Si votre code propriétaire est sur GitHub sans plan Enterprise avec data protection activée, il peut désormais alimenter Copilot — vérifiez vos paramètres de dépôt et le niveau de votre abonnement dès aujourd'hui. Pour les équipes en Europe, le RGPD impose un consentement explicite que GitHub n'a pas encore clairement formalisé, ce qui crée une fenêtre de risque réel. C'est le moment de décider si GitLab self-hosted ou les GitHub Enterprise controls valent le coût.

RégulationReglementation
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic