Aller au contenu principal
Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez
ÉthiqueLes Numériques IA12sem· 1 min de lecture

Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez

Source originale ↗·

Microsoft s'apprête à utiliser les données des utilisateurs de GitHub Copilot pour entraîner ses modèles d'intelligence artificielle. La firme de Redmond a discrètement mis à jour ses conditions d'utilisation pour introduire cette collecte de données, activée par défaut — les utilisateurs devront explicitement refuser s'ils souhaitent en être exemptés.

Cette décision s'inscrit dans la stratégie de Microsoft de rentabiliser son acquisition de GitHub en 2018 pour 7,5 milliards de dollars. Avec des dizaines de millions de développeurs actifs sur la plateforme, les données de code, de prompts et d'interactions représentent un corpus d'entraînement d'une valeur considérable pour améliorer GitHub Copilot et les modèles sous-jacents développés en partenariat avec OpenAI.

Le mécanisme retenu est celui de l'opt-out plutôt que de l'opt-in, ce qui signifie que la collecte est consentie par défaut pour l'ensemble des abonnés. Cette approche, légalement encadrée mais critiquée par les défenseurs de la vie privée, maximise le volume de données collectées. Les utilisateurs souhaitant protéger leur code devront naviguer dans les paramètres de leur compte pour désactiver manuellement cette fonctionnalité.

Ce mouvement de Microsoft s'inscrit dans une tendance de fond : les grandes plateformes tech réorientent leurs bases d'utilisateurs existantes vers l'alimentation de leurs pipelines IA. Pour les développeurs travaillant sur des projets sensibles ou propriétaires, la vigilance s'impose — une vérification des paramètres GitHub Copilot est désormais recommandée.

Impact France/UE

Les développeurs européens utilisant GitHub Copilot doivent se désinscrire activement pour protéger leur code propriétaire ; le RGPD pourrait contraindre Microsoft à imposer un mécanisme d'opt-in explicite pour les utilisateurs de l'UE.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

GitHub utilisera les données d'interaction Copilot pour entraîner ses modèles IA à partir d'avril 2026
1The Decoder 

GitHub utilisera les données d'interaction Copilot pour entraîner ses modèles IA à partir d'avril 2026

À partir du 24 avril 2026, GitHub modifie sa politique de données pour Copilot, son assistant de programmation alimenté par l'intelligence artificielle. Les interactions des utilisateurs abonnés aux plans Free, Pro et Pro+ seront désormais exploitées pour entraîner les modèles d'IA, sauf si ces derniers choisissent explicitement de se désinscrire. Ce changement opt-out — plutôt qu'opt-in — place la charge de la protection sur l'utilisateur, et non sur la plateforme. Cette décision touche potentiellement des dizaines de millions de développeurs qui utilisent Copilot au quotidien pour générer, compléter et réviser du code. En collectant des données d'interaction réelles — requêtes, suggestions acceptées ou rejetées, contexte du code — GitHub et sa maison mère Microsoft obtiennent un corpus d'entraînement d'une valeur considérable pour améliorer leurs modèles. Pour les développeurs travaillant sur des projets sensibles ou propriétaires, le risque perçu est que des fragments de code ou des pratiques internes alimentent indirectement un système partagé. GitHub s'inscrit ainsi dans une tendance plus large : plusieurs grandes plateformes tech, d'Adobe à LinkedIn, ont récemment mis à jour leurs conditions d'utilisation pour inclure des clauses similaires, déclenchant à chaque fois des controverses. Microsoft, qui a investi massivement dans OpenAI et intégré Copilot dans l'ensemble de son écosystème, a un intérêt stratégique direct à maximiser la qualité de ses modèles de code. Les utilisateurs souhaitant protéger leurs données devront se rendre dans les paramètres de leur compte avant la date butoir du 24 avril pour désactiver cette collecte.

UELe modèle opt-out de GitHub pourrait être incompatible avec le RGPD, qui impose un consentement explicite et préalable — les développeurs européens doivent agir avant le 24 avril 2026, et la CNIL ou le CEPD pourraient examiner la légalité de cette politique.

BusinessOpinion
1 source
Le portail d’actualités MSN de Microsoft rémunère une quarantaine de médias générés par IA
2Next INpact 

Le portail d’actualités MSN de Microsoft rémunère une quarantaine de médias générés par IA

Le portail d'actualités MSN de Microsoft, intégré par défaut dans le widget Actualités de tous les PC sous Windows, rémunère une quarantaine de médias dont le contenu est entièrement ou majoritairement généré par intelligence artificielle, selon une enquête récente. Cette pratique contrevient aux propres lignes directrices de Microsoft, qui affirme pourtant travailler avec plus de 1 300 éditeurs de presse représentant plus de 4 500 marques à l'échelle mondiale pour offrir « le meilleur des informations en ligne ». Le portail revendique combiner algorithmes et modération humaine pour garantir des contenus conformes à ses valeurs, mais la page de présentation de sa direction éditoriale liste quatre responsables dont aucun ne travaille plus pour l'entreprise depuis 2022, 2023 ou 2024. Par ailleurs, MSN diffuse massivement des vidéos à caractère conspirationniste et favorise de manière disproportionnée les contenus de CNews, la chaîne du groupe Bolloré reconvertie en média d'opinion. Le problème dépasse la simple incohérence éditoriale : en finançant des sites automatisés via des accords de partenariat, Microsoft contribue directement à monétiser la désinformation industrielle et à fragiliser les médias traditionnels qui investissent dans des journalistes humains. Le widget Actualités de Windows étant préinstallé sur des centaines de millions de machines, la portée de ces recommandations est considérable. Des millions d'utilisateurs reçoivent ainsi, sans le savoir, un flux mêlant sources vérifiées et contenus produits à la chaîne par des IA, sans distinction apparente de fiabilité. Cette situation s'inscrit dans une trajectoire entamée en 2020, lorsque Microsoft avait licencié près de 80 journalistes constituant ses équipes éditoriales américaine et britannique, confiant intégralement la curation à des algorithmes. Ce virage vers l'automatisation, présenté à l'époque comme une modernisation, a ouvert la porte à des dérives que la plateforme ne semble ni surveiller ni corriger. La question de la responsabilité des agrégateurs technologiques dans la qualité de l'information distribuée est au coeur de débats réglementaires en Europe, notamment autour du Digital Services Act. Le cas MSN illustre la tension entre la logique économique des plateformes, qui profitent du trafic généré par tout contenu engageant quelle qu'en soit la source, et les engagements de qualité qu'elles affichent publiquement. Aucune réaction officielle de Microsoft n'avait été communiquée au moment de la publication de l'enquête.

UELe financement de contenus générés par IA fragilise les médias européens investissant dans le journalisme humain et soulève une question directe de conformité avec le Digital Services Act, notamment concernant la recommandation disproportionnée de CNews en France.

ÉthiqueOpinion
1 source
Vous utilisez Claude ? Anthropic pourrait bientôt vous demander une preuve d’identité
3Le Big Data 

Vous utilisez Claude ? Anthropic pourrait bientôt vous demander une preuve d’identité

À partir du 8 juillet 2026, Anthropic modifiera sa politique de confidentialité pour introduire une nouvelle possibilité de vérification d'identité sur ses comptes individuels Claude Free, Pro et Max. Concrètement, l'entreprise se réserve le droit de demander à certains utilisateurs de confirmer leur âge ou leur identité dans des situations ciblées : comportement jugé suspect ou doute sur la majorité de la personne. La vérification ne sera pas systématique mais activée au cas par cas. Pour la mettre en œuvre, Anthropic s'appuie sur Persona, une société spécialisée dans ce domaine. Le processus peut requérir une pièce d'identité officielle, une photo ou une vidéo du visage, ainsi que des modèles de géométrie faciale pour confirmer l'identité. Les comptes Entreprise et Team ne sont pas concernés par ces nouvelles dispositions. Cette évolution marque une rupture symbolique dans la relation entre les outils d'IA grand public et leurs utilisateurs. Jusqu'ici, ouvrir un compte Claude relevait de la même simplicité qu'un service en ligne classique. Introduire la biométrie et les documents d'identité dans l'équation rapproche Claude des procédures KYC ("Know Your Customer") habituellement réservées aux banques ou aux plateformes de cryptomonnaies. Pour les utilisateurs concernés, le changement est concret : accéder à certaines fonctionnalités pourrait désormais nécessiter de soumettre des données parmi les plus sensibles qui soient. Sur les réseaux sociaux, plusieurs voix s'inquiètent d'une normalisation progressive des contrôles d'identité dans les interfaces d'IA, à mesure que ces outils gagnent en puissance et en profondeur d'usage. Cette décision s'inscrit dans un contexte plus large de montée en pression réglementaire et de responsabilisation des plateformes d'IA. Les modèles génératifs sont de plus en plus capables de produire des contenus sensibles ou d'accéder à des fonctionnalités avancées, ce qui incite les développeurs à mieux contrôler qui les utilise et dans quel cadre. Anthropic présente ces changements comme une formalisation de pratiques déjà existantes, et insiste sur le fait que les documents transmis restent stockés chez Persona et ne sont jamais utilisés pour entraîner ses modèles. Néanmoins, la question de la confiance reste entière : les outils d'IA centralisent déjà des volumes considérables de données personnelles, et l'ajout d'une couche biométrique alimente un débat qui dépasse largement Claude. D'autres acteurs du secteur pourraient rapidement suivre cette même direction si la pression légale ou les incidents de sécurité s'intensifient.

UELes données biométriques (géométrie faciale, photo d'identité) sont des données sensibles au sens du RGPD, ce qui contraint Anthropic à obtenir un consentement explicite et à satisfaire des obligations renforcées pour tout utilisateur français ou européen de Claude soumis à cette vérification.

💬 Le KYC arrive dans le chatbot, c'était prévisible. Ce qui me gêne, c'est pas la vérification d'âge (ça se défend quand l'outil devient aussi puissant), c'est la géométrie faciale que tu confies à Persona, une boîte dont tu n'as jamais entendu parler. Et si ça fait école, on aura normalisé la biométrie pour accéder à une IA sans vraiment avoir eu le choix.

ÉthiqueOpinion
1 source
Microsoft, Meta et xAI collectent des données d'entraînement auprès de leurs propres employés
4The Information AI 

Microsoft, Meta et xAI collectent des données d'entraînement auprès de leurs propres employés

Microsoft, Meta et xAI ont recours à une source de données d'entraînement peu conventionnelle pour leurs modèles d'intelligence artificielle : leurs propres salariés. Microsoft est la dernière entreprise à avoir formalisé cette approche, en annonçant qu'elle prévoit d'exploiter le code propriétaire produit par ses quelque 100 000 ingénieurs logiciels pour entraîner ses modèles de programmation. Cette stratégie s'inscrit dans une tendance plus large observée chez les grands acteurs du secteur, qui cherchent à contourner la pénurie de données de qualité sur le marché ouvert. L'enjeu est considérable pour Microsoft, dont GitHub Copilot a perdu une partie de son avance initiale face à des concurrents comme Anthropic ou Cursor. En mobilisant les productions internes de ses développeurs, l'entreprise espère constituer un corpus de données riche, contextualisé et propriétaire, que ses rivaux ne peuvent tout simplement pas répliquer. Pour les salariés concernés, cette pratique soulève des questions sur la propriété intellectuelle et le consentement éclairé : leurs contributions professionnelles quotidiennes deviennent du carburant pour des systèmes commerciaux. Ce phénomène révèle une tension croissante dans l'industrie de l'IA : les jeux de données publics s'épuisent ou font l'objet de litiges juridiques, forçant les entreprises à se tourner vers des données internes ou synthétiques. Meta et xAI ont adopté des démarches similaires, transformant leurs effectifs en contributeurs involontaires à l'effort d'entraînement. La question de la gouvernance de ces données employés, et des droits qui s'y rattachent, devrait s'imposer comme un nouveau terrain de friction entre entreprises, syndicats et régulateurs dans les mois à venir.

UELa collecte de données professionnelles d'employés à des fins d'entraînement sans consentement explicite pourrait tomber sous le coup du RGPD, ouvrant la voie à des enquêtes des autorités européennes de protection des données et à de nouveaux contentieux syndicaux en Europe.

ÉthiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic