Aller au contenu principal
Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs
ÉthiqueLe Big Data6sem· 2 min de lecture

Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs

Source originale ↗·

L'Université de Washington a dû abandonner un projet de recherche après une levée de boucliers de parents d'élèves. L'étude prévoyait d'équiper des enseignants de maternelle de caméras embarquées et d'installer des dispositifs fixes dans les salles de classe, afin de capter les interactions quotidiennes entre professeurs et enfants. Ces enregistrements devaient alimenter des modèles d'intelligence artificielle capables d'analyser la qualité pédagogique des échanges en classe. Le dispositif reposait sur un opt-out qui incluait automatiquement tous les enfants, sauf refus explicite des parents. Selon 404 Media, qui a consulté les documents transmis aux familles, les vidéos pouvaient être traitées via des services d'IA hébergés dans le cloud, sans que les entreprises impliquées ni les modèles utilisés ne soient nommément identifiés. Face aux protestations, l'université a confirmé l'arrêt du programme peu après les premières réactions négatives.

Les parents ont soulevé des questions concrètes restées sans réponse satisfaisante : que devenait l'image d'un enfant dont la famille refusait de participer, dans une classe où tous les autres élèves étaient filmés ? Les chercheurs promettaient de masquer visages et noms "dans la mesure du possible", une formulation jugée nettement insuffisante. S'y ajoutaient des problèmes d'accessibilité : de nombreuses familles issues de l'immigration ne parlaient pas anglais, et aucun formulaire traduit n'était disponible. Faith Boninger, codirectrice du National Education Policy Center, a également pointé l'opacité du dispositif, notamment l'absence de réponse claire sur qui pouvait accéder aux données, combien de temps elles seraient conservées, et qui finançait réellement la recherche. Un parent interrogé anonymement par 404 Media résumait l'inquiétude collective : "Je suis troublé par l'idée que l'image de mon enfant soit utilisée dans des outils d'IA inconnus."

Cet incident s'inscrit dans un mouvement de fond : l'IA s'impose rapidement dans l'éducation, portée par des investissements massifs d'entreprises comme OpenAI, Anthropic et Microsoft, qui multiplient partenariats universitaires et accès gratuits aux outils génératifs pour les étudiants et enseignants. Mais développer des modèles spécialisés dans l'éducation nécessite des volumes considérables de données réelles, et c'est précisément là que le bât blesse. Les établissements scolaires, qui accueillent des mineurs dans un cadre légalement protégé, deviennent des terrains convoités pour la collecte de données d'entraînement. L'échec du projet de l'Université de Washington illustre la tension croissante entre les besoins de l'industrie IA et les droits fondamentaux des familles, en particulier autour du consentement éclairé. À mesure que ces projets se multiplient, la gouvernance des données issues des environnements scolaires ne peut plus être reléguée en note de bas de page d'un formulaire incompréhensible.

Impact France/UE

Le RGPD impose en Europe un consentement explicite pour le traitement des données de mineurs, rendant un dispositif d'opt-out similaire illégal, mais l'incident souligne la vigilance nécessaire face aux projets de recherche en IA dans les établissements scolaires européens.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Meta voulait espionner ses employés pour l’IA, ça tourne au fiasco en interne
1Le Big Data 

Meta voulait espionner ses employés pour l’IA, ça tourne au fiasco en interne

Le 22 juin 2026, Meta a suspendu son programme MCI (Model Capability Initiative), une initiative interne conçue pour entraîner des modèles d'intelligence artificielle à partir du comportement réel de ses propres employés. Concrètement, le système captait les mouvements de souris, les frappes au clavier, les clics et parfois des captures d'écran des machines des salariés. La suspension a été déclenchée après la découverte d'un problème de configuration ayant exposé des données sensibles d'employés à un nombre de personnes bien plus large que prévu au sein de l'entreprise. La porte-parole Tracy Clayton a précisé qu'aucune intrusion externe n'avait été détectée et qu'aucun comportement suspect de la part des employés n'avait été observé. L'enquête est en cours pour déterminer l'étendue exacte de l'incident. La révélation fragilise davantage un programme déjà contesté en interne. Avant même cet incident, plusieurs employés avaient exprimé des inquiétudes sur la vie privée, la sécurité des données et l'impact concret sur les performances de leurs machines, certains signalant un ralentissement notable au quotidien. Début juin, Meta avait tenté de calmer les tensions en permettant aux salariés de suspendre temporairement la collecte ou de demander une exemption totale, mais ces ajustements n'ont pas suffi à restaurer la confiance. L'incident du 22 juin transforme ce qui était une friction interne gérable en une crise de crédibilité pour le dispositif entier, renforçant les doutes sur la capacité de Meta à gérer responsablement des données aussi sensibles que celles de ses propres collaborateurs. Le MCI s'inscrit dans une course que se livrent les grandes entreprises technologiques pour améliorer leurs modèles d'IA avec des données comportementales de haute qualité, difficiles à obtenir autrement. Utiliser les données des employés comme terrain d'entraînement est une approche risquée sur le plan légal et éthique, notamment en Europe où le RGPD encadre strictement ce type de collecte. Meta, qui développe activement ses modèles Llama et cherche à combler son retard face à OpenAI et Google sur les assistants IA, se retrouve donc dans une position délicate : abandonner le programme signifie perdre un avantage potentiel, mais le maintenir sans reconstruction complète de la confiance interne semble difficile. La suite dépendra des conclusions de l'enquête et de la capacité de l'entreprise à proposer un cadre de collecte jugé acceptable par ses propres équipes.

UELa collecte de données comportementales d'employés (frappes clavier, captures d'écran) pour entraîner des modèles IA serait soumise au RGPD en Europe, exposant Meta à des risques juridiques majeurs si le programme venait à s'appliquer à ses salariés européens.

ÉthiqueOpinion
1 source
☕️ Meta veut regarder tout ce que font ses employés pour entraîner ses IA
2Next INpact 

☕️ Meta veut regarder tout ce que font ses employés pour entraîner ses IA

Meta a discrètement déployé un outil de surveillance baptisé Model Capability Initiative (MCI) sur les ordinateurs de ses employés, révèlent des mémos internes obtenus par Reuters. Concrètement, le dispositif enregistre l'intégralité des interactions des salariés avec leurs applications et sites web, mouvements de curseur, clics, frappes clavier, et effectue des captures d'écran à intervalles réguliers. L'entreprise précise que MCI n'a pas vocation à évaluer la productivité des employés ni à les surveiller au sens disciplinaire du terme, et affirme avoir mis en place des protections pour les "contenus sensibles", sans en détailler la nature. Andrew Bosworth, directeur technique du groupe, a exposé l'ambition derrière l'initiative dans un mémo interne : construire un environnement où les agents IA réalisent l'essentiel du travail pendant que les humains les dirigent, les évaluent et les corrigent. L'enjeu est précis : les modèles d'IA de Meta peinent à reproduire fidèlement les comportements humains face à un ordinateur, sélectionner une option dans un menu déroulant, enchaîner des raccourcis clavier, naviguer intuitivement entre applications. Ces lacunes limitent directement les capacités des agents IA qui prennent le contrôle d'un poste de travail à la place de l'utilisateur. En collectant des données comportementales réelles en conditions de travail, Meta espère combler ces angles morts et produire des agents capables, selon les mots de Bosworth, "d'identifier automatiquement les moments où nous avons ressenti le besoin d'intervenir, afin de faire mieux la fois suivante". C'est un pari industriel majeur : la course aux agents autonomes se joue désormais sur la qualité des données d'entraînement comportementales, et Meta entend utiliser ses propres effectifs comme terrain d'expérimentation. L'initiative se heurtera probablement à des obstacles juridiques significatifs en Europe. Le RGPD encadre strictement la collecte de données personnelles, y compris en contexte professionnel, et plusieurs législations nationales vont plus loin encore. En Italie, la surveillance électronique de la productivité des salariés est explicitement interdite. En France, si l'employeur peut accéder au matériel informatique mis à disposition des salariés, il doit préalablement informer les employés concernés et consulter les représentants du personnel, comité d'entreprise et comité social et économique. La CNIL a rappelé à plusieurs reprises que tout dispositif de surveillance doit être "strictement proportionné à l'objectif suivi" et ne peut servir à une surveillance permanente ; les keyloggers sont d'ailleurs explicitement cités parmi les outils prohibés. Meta devra donc adapter ou suspendre MCI dans plusieurs pays européens, sous peine de sanctions qui pourraient compromettre l'ensemble du programme.

UEMeta devra suspendre ou adapter son outil MCI en France et dans l'UE, où le RGPD, la CNIL (qui interdit explicitement les keyloggers) et le droit du travail français (consultation obligatoire du CSE) s'opposent à une surveillance permanente des salariés à des fins d'entraînement IA.

💬 Le problème des agents IA, c'est pas l'intelligence, c'est les micro-gestes : savoir qu'après ce menu tu fais Tab et pas clic, que ce champ se remplit dans tel ordre. Pour combler ça, Meta filme ses propres employés en permanence. Bon, sur le papier c'est du bon sens industriel, mais en Europe c'est un keylogger permanent sur du matériel pro, et la CNIL a été très claire là-dessus : non.

ÉthiqueReglementation
1 source
Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA
3The Verge 

Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA

Meta installe en ce moment un outil de surveillance sur les ordinateurs de ses employés basés aux États-Unis, selon une information révélée par Reuters. L'outil, baptisé Model Capability Initiative (MCI), tourne en arrière-plan dans les applications et sites web liés au travail et enregistre les mouvements de souris, les clics, les frappes au clavier ainsi que des captures d'écran ponctuelles. L'objectif affiché par l'entreprise est d'utiliser ces données comportementales pour entraîner ses modèles d'intelligence artificielle à interagir avec les ordinateurs de la même façon que le font les humains au quotidien. Meta précise que les données collectées ne seront pas utilisées à des fins d'évaluation des performances des salariés. Cette initiative s'inscrit dans la course aux agents IA capables d'automatiser des tâches informatiques complexes, remplir des formulaires, naviguer dans des interfaces, exécuter des workflows bureautiques. En capturant directement les gestes réels de travailleurs qualifiés, Meta cherche à constituer un jeu de données d'entraînement à haute valeur, bien plus représentatif que des données synthétiques. Pour les employés concernés, cela soulève des questions concrètes sur la frontière entre contribution au produit et surveillance au travail. La démarche rappelle celle d'autres géants tech qui collectent des données humaines pour affiner leurs systèmes d'automatisation, comme Google ou Microsoft avec leurs outils Copilot. Meta, qui développe activement ses propres agents IA sous l'impulsion de Mark Zuckerberg, considère visiblement ses équipes internes comme un terrain d'entraînement privilégié. Le fait que le programme soit pour l'instant limité aux États-Unis suggère des contraintes légales en Europe, où le RGPD encadre strictement ce type de collecte en milieu professionnel.

UELe RGPD protège directement les salariés européens de Meta contre ce type de surveillance systématique, ce qui explique que le programme soit pour l'instant limité aux États-Unis et soulève des questions sur la conformité des pratiques de collecte de données en milieu professionnel au sein de l'UE.

ÉthiqueActu
1 source
Comment les musiciens peuvent être rémunérés pour l'entraînement de l'IA
4IEEE Spectrum AI 

Comment les musiciens peuvent être rémunérés pour l'entraînement de l'IA

Warner Music Group a récemment acquis la startup Sureel, spécialisée dans la gestion des droits musicaux à l'ère de l'intelligence artificielle. Sureel s'est associée à l'agence suédoise de droits d'auteur STIM pour explorer un système de rémunération des artistes lorsque leur musique sert à entraîner des modèles d'IA générative. Concrètement, le logiciel de Sureel appose des métadonnées sur les fichiers audio afin d'indiquer si une entreprise d'IA est autorisée à utiliser le fichier librement, de manière limitée ou pas du tout, puis suit l'utilisation réelle pour calculer les redevances correspondantes. De son côté, la société d'IA musicale SoundVerse a publié un livre blanc en 2025 pour rejeter les rachats uniques de droits et défendre une participation continue des artistes à chaque génération d'output par un modèle. Le co-président de Sureel, Benji Rogers, et son PDG, Tamay Aykut, portent le projet, tandis que Simon Gozzi, directeur du développement chez STIM, évalue comment les rapports d'attribution de Sureel pourraient fonder de nouveaux accords de licence entre musiciens et entreprises d'IA. L'enjeu est considérable pour l'ensemble de l'industrie musicale, qui dispose depuis des décennies de mécanismes précis pour rémunérer l'utilisation des œuvres, ventes physiques, streaming, radio, reprises, karaoké. L'IA générative a fracturé cette logique en rendant floue la notion d'utilisation : une chanson utilisée une seule fois pour l'entraînement d'un modèle continue d'influencer chaque output produit par ce modèle. Sureel propose d'aller plus loin qu'une simple mesure de similarité entre la donnée d'entraînement et l'output généré, en cherchant à établir un lien de causalité réel entre les deux. Si le modèle produit du jazz, les enregistrements jazz du corpus auraient davantage contribué que les pièces folk, et seraient rémunérés en proportion. Rogers résume l'ambition : "L'attribution ne cherche pas à recréer l'ancienne économie, mais à mesurer pour la première fois ce que l'ancienne économie ne faisait qu'approximer." Ce chantier s'inscrit dans un contexte de tension croissante entre l'industrie créative et les géants de l'IA, accusés par certains de commettre "le plus grand acte de vol de droits d'auteur de l'histoire". La question de l'attribution causale reste techniquement non résolue et pourrait nécessiter des outils issus de la théorie de l'information ou une modélisation de l'impact historique des œuvres individuelles. Le risque existe aussi de voir naître une musique conçue pour maximiser les redevances d'entraînement, comme le streaming a déjà poussé les artistes à raccourcir leurs intros. Aykut suggère néanmoins que des systèmes d'attribution bien conçus pourraient valoriser les œuvres rares et originales davantage que les tubes radiophoniques, ouvrant la possibilité que l'IA devienne un vecteur de diversité musicale plutôt qu'un facteur d'uniformisation.

UELa participation de l'agence suédoise STIM à ce système d'attribution ouvre la voie à de nouveaux cadres de licence pour les artistes européens, en cohérence avec les exigences de l'AI Act sur la transparence des données d'entraînement.

💬 Ce que Sureel essaie de faire, c'est mesurer l'influence réelle d'une œuvre sur un modèle, pas juste vérifier si elle était dans le corpus de départ. Ça paraît évident dit comme ça, mais c'est techniquement non résolu, et si ça marche, ça change tout à la logique des licences forfaitaires. Le vrai risque après, c'est l'effet streaming : des artistes qui composent pour maximiser leurs redevances d'entraînement plutôt que pour les oreilles.

ÉthiqueReglementation
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic