Aller au contenu principal
Les LLM peuvent révéler l'identité de utilisateurs pseudonymes à grande échelle avec une précision surprenante
RechercheArs Technica AI15sem· 1 min de lecture

Les LLM peuvent révéler l'identité de utilisateurs pseudonymes à grande échelle avec une précision surprenante

Source originale ↗·

Les modèles de grande langue (LLMs) peuvent désormais démasquer les utilisateurs pseudonymes à grande échelle avec une précision surprenante, selon une étude récente. Les chercheurs ont démontré que des algorithmes peuvent associer des individus à des comptes ou des publications sur plusieurs plateformes sociales, atteignant un taux de réussite de 68% et une précision de 90%. Cette avancée menace la pseudonymité, un moyen de protection de la vie privée utilisé par de nombreuses personnes pour participer à des discussions publiques sensibles tout en minimisant la possibilité d'être identifiées, mais qui expose maintenant ces utilisateurs à des risques comme le doxxing, le harcèlement et la création de profils marketing détaillés.

Impact France/UE

Cette capacité à désanonymiser les utilisateurs à grande échelle constitue une menace directe pour les droits des citoyens européens protégés par le RGPD, notamment le droit à la vie privée et à la pseudonymité en ligne, et pourrait contraindre les autorités de protection des données comme la CNIL à encadrer l'utilisation de tels modèles.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Rendre les chatbots IA plus utiles nuit à leur capacité à simuler le comportement humain, selon une étude à grande échelle
1The Decoder 

Rendre les chatbots IA plus utiles nuit à leur capacité à simuler le comportement humain, selon une étude à grande échelle

Une étude de grande envergure portant sur 208 000 participants et 26 millions de réponses révèle un paradoxe fondamental dans le développement des assistants conversationnels : l'entraînement qui rend les modèles de langage utiles et agréables à utiliser dégrade simultanément leur capacité à reproduire fidèlement les comportements humains. Plus un modèle est optimisé pour être serviable, poli et aligné sur les attentes des utilisateurs, moins il parvient à simuler la diversité réelle des réponses humaines. L'effet s'aggrave à chaque nouvelle génération de modèles. Ce résultat a des conséquences directes pour les chercheurs en sciences sociales, économistes et psychologues qui utilisent de plus en plus les LLM comme substituts aux sondages humains classiques, jugés coûteux et lents. Si ces modèles ne peuvent pas reproduire de manière fiable les comportements individuels, leur valeur comme outils de simulation sociale est sérieusement remise en question. La technique populaire consistant à fournir aux modèles des profils démographiques détaillés, souvent appelée "persona prompting", n'apporte pratiquement aucun gain de précision au niveau individuel. Ce constat s'inscrit dans un débat plus large sur la nature de l'alignement des LLM : en optimisant pour la satisfaction de l'utilisateur via le renforcement humain (RLHF), les entreprises comme OpenAI, Anthropic ou Google créent des modèles qui s'homogénéisent vers un comportement "acceptable" au détriment de la variabilité humaine. Les chercheurs appellent à distinguer clairement les cas d'usage où l'alignement est souhaitable de ceux où la fidélité comportementale est requise.

UELes chercheurs européens en sciences sociales, économie et psychologie doivent revoir leur méthodologie : les LLM alignés ne peuvent pas remplacer fiablement des participants humains dans les études comportementales à l'échelle individuelle.

💬 Résultat presque évident une fois qu'on le lit, sauf que personne ne l'avait mesuré à cette échelle : plus tu rends un LLM utile et poli, moins il ressemble à un humain réel. 208 000 participants, 26 millions de réponses, c'est difficile à contester. Les chercheurs en sciences sociales qui remplaçaient leurs sondages par des LLM vont devoir revoir leurs copies, et pas qu'un peu.

RecherchePaper
1 source
Metis d'Alibaba réduit les appels d'outils IA redondants de 98 % à 2 %, avec une meilleure précision
2VentureBeat AI 

Metis d'Alibaba réduit les appels d'outils IA redondants de 98 % à 2 %, avec une meilleure précision

Des chercheurs d'Alibaba ont publié un cadre d'apprentissage par renforcement appelé HDPO (Hierarchical Decoupled Policy Optimization), conçu pour entraîner des agents IA à mieux décider quand utiliser des outils externes et quand s'appuyer sur leurs propres connaissances. Appliqué à leur modèle multimodal Metis, ce framework réduit les appels d'outils redondants de 98 % à seulement 2 %, tout en améliorant la précision sur les benchmarks de référence du secteur. L'enjeu est concret : les agents IA actuels ont tendance à invoquer systématiquement des utilitaires externes comme la recherche web ou l'exécution de code, même lorsque la question posée ne le nécessite pas. Chaque appel inutile crée un goulet d'étranglement de traitement séquentiel, alourdit les coûts d'API et injecte du bruit dans le contexte du modèle, ce qui dégrade la qualité du raisonnement final. Ce problème touche directement les entreprises qui déploient des agents IA en production : des systèmes techniquement capables deviennent lents et coûteux à opérer, sans que cela se traduise par de meilleures réponses. Les approches précédentes tentaient de corriger ce comportement en combinant précision et efficacité dans un seul signal de récompense, mais cette conception créait un dilemme d'optimisation insoluble. Une pénalité trop forte sur l'usage des outils rend le modèle trop conservateur et nuit à sa précision sur les tâches complexes, tandis qu'une pénalité trop faible ne change rien au comportement. Pire, ce signal mélangé crée une ambiguïté sémantique : une réponse incorrecte sans aucun appel d'outil pouvait obtenir la même récompense qu'une réponse correcte avec un usage excessif. HDPO résout ce paradoxe en séparant les deux objectifs dans des canaux d'optimisation indépendants. Le canal de précision maximise la justesse des réponses sur l'ensemble des rollouts, tandis que le canal d'efficacité minimise les appels superflus. Les deux signaux ne sont combinés qu'à la dernière étape du calcul de la perte, et surtout, l'efficacité reste conditionnelle à la précision : une réponse incorrecte n'est jamais récompensée simplement parce qu'elle a été rapide ou économe en appels. Cette décorrélation offre au modèle des gradients d'apprentissage propres pour chaque objectif, sans interférence. Alibaba s'inscrit dans une course intense au développement d'agents IA fiables et économiques, où la maîtrise du coût opérationnel est devenue aussi stratégique que la performance brute. HDPO représente une avancée méthodologique qui pourrait influencer la façon dont l'ensemble de l'industrie entraîne ses agents à instrumenter le monde extérieur avec discernement plutôt qu'automatisme.

RecherchePaper
1 source
NVIDIA AI présente ProRL Agent : une infrastructure d'apprentissage par renforcement pour agents LLM à grande échelle
3MarkTechPost 

NVIDIA AI présente ProRL Agent : une infrastructure d'apprentissage par renforcement pour agents LLM à grande échelle

NVIDIA a présenté ProRL Agent, une infrastructure open source conçue pour entraîner des agents LLM multi-tours par apprentissage par renforcement (RL) à grande échelle. Publiée via un article de recherche (arXiv:2603.18815), cette solution adopte une philosophie « Rollout-as-a-Service » : le service de rollout fonctionne comme un serveur HTTP autonome, totalement découplé de la boucle d'entraînement. Le système s'appuie sur un pipeline asynchrone en trois étapes — initialisation des environnements sandbox, exécution des trajectoires d'agent, évaluation des résultats — chaque étape disposant de son propre pool de workers pour maximiser le débit. Pour la compatibilité avec les clusters HPC sous Slurm, ProRL Agent utilise Singularity plutôt que Docker, permettant une exécution sans droits root. Des optimisations de bas niveau réduisent drastiquement la latence des outils : remplacement de tmux par un terminal pseudo-TTY direct (latence bash réduite de 0,78 s à 0,42 s), connexion directe aux kernels IPython via API in-process, et remplacement du TCP par des sockets Unix pour la communication interne aux conteneurs. Le problème que résout cette architecture est fondamental pour quiconque entraîne des agents LLM modernes : les tâches multi-tours impliquent des interactions répétées avec des environnements externes (dépôts de code, systèmes d'exploitation, outils) qui sont intensives en I/O, tandis que la mise à jour du modèle est intensive en GPU. Les frameworks existants — SkyRL, VeRL-Tool, Agent Lightning, rLLM, GEM — fusionnent ces deux phases dans un même processus, créant des conflits de ressources qui dégradent l'efficacité matérielle et compliquent la maintenance. ProRL Agent élimine ces interférences en rendant le trainer entièrement agnostique à l'infrastructure de rollout, et introduit en prime un mécanisme de réutilisation du cache de préfixes via un load balancer min-heap sur les backends vLLM, accélérant l'inférence sur les longues séquences multi-tours. Autre innovation notable : la communication en token IDs de bout en bout, qui évite les dérives de re-tokenisation entre rollout et training — une source de bugs silencieux dans les pipelines RL existants. Ce travail s'inscrit dans une course industrielle intense pour rendre l'entraînement RL des agents LLM praticable à l'échelle. Depuis les succès de DeepSeek-R1 et des modèles de raisonnement d'OpenAI, le RL appliqué aux LLM est devenu un axe stratégique majeur, mais les infrastructures peinent à suivre la complexité des tâches agentiques longues. NVIDIA, avec ses GPU dominants dans les data centers, a un intérêt direct à proposer des solutions qui maximisent l'utilisation de son matériel. ProRL Agent inclut également une implémentation optimisée de DAPO (Dynamic Advantage Policy Optimization), un algorithme récent qui améliore la stabilité de l'entraînement. La prochaine étape sera de voir si cette infrastructure est adoptée par la communauté de recherche ou si elle reste un outil interne à NVIDIA pour ses propres expérimentations sur les agents autonomes.

RecherchePaper
1 source
Atteint de SLA, il est le premier grand utilisateur d'un implant cérébral qui lui permet de parler
4MIT Technology Review 

Atteint de SLA, il est le premier grand utilisateur d'un implant cérébral qui lui permet de parler

Casey Harrell, 45 ans au moment des faits, atteint de sclérose latérale amyotrophique (SLA) et entièrement paralysé, est devenu le premier "power user" d'un implant cérébral destiné à restaurer la parole. En juillet 2023, une équipe de l'Université de Californie à Davis, dirigée par David Brandman, professeur associé de neurochirurgie, lui a implanté quatre réseaux de 64 électrodes chacun dans le cerveau, reliés à deux points de connexion fixés sur le crâne. Dès août 2023, un mois après l'opération, Harrell communiquait avec un vocabulaire de 50 mots et un taux de précision de 99,6 %. Ce vocabulaire a depuis été étendu à 125 000 mots, avec une précision de 97,5 %. Sur les 22,6 premiers mois suivant l'implantation, il a utilisé le dispositif plus de 3 800 heures à domicile sans la présence de chercheurs, selon une étude publiée cette semaine dans la revue Nature Medicine. L'avancée la plus significative tient à l'autonomie croissante de Harrell. En 2023, des membres de l'équipe devaient encore se rendre physiquement chez lui pour connecter et déconnecter l'appareil. Aujourd'hui, son soignant effectue seul cette opération : Harrell se réveille, est branché, et commence sa journée. Il surfe sur le web et exerce son travail grâce à l'interface. "Vivre avec une maladie comme la SLA, on est censé avoir des rêves diminués. Ce n'est pas mon cas", confie-t-il au MIT Technology Review. Cette autonomie est décisive : elle démontre qu'un tel dispositif peut fonctionner efficacement sur le long terme hors cadre clinique, et qu'un patient gravement atteint peut s'en emparer comme d'un véritable outil quotidien. Le système repose sur le décodage du cortex moteur de la parole, la région cérébrale qui coordonne les mouvements nécessaires à l'articulation. En enregistrant l'activité neuronale liée aux 39 phonèmes de l'anglais américain, les algorithmes construisent un décodeur personnalisé qui convertit les signaux cérébraux en parole synthétisée. L'une des grandes incertitudes des interfaces cerveau-ordinateur (BCI) à long terme est la formation de tissu cicatriciel autour des électrodes, susceptible de dégrader la captation des signaux neuronaux. Ce phénomène ne semble pas affecter Harrell à ce stade, ce qui est en soi un résultat encourageant. La SLA touche environ 30 000 personnes aux États-Unis. Des acteurs comme Neuralink et Synchron travaillent également sur des BCI humains, mais la durabilité et l'autonomisation démontrées par le cas Harrell constituent un jalon concret vers des dispositifs cliniquement viables, utilisables au quotidien par des patients en dehors de tout laboratoire.

💬 125 000 mots, 97,5 % de précision, 3 800 heures d'usage autonome à domicile. Ce qui me frappe, c'est pas la performance du décodeur, c'est que Casey Harrell se lève le matin, se branche, et commence sa journée comme tu commences la tienne. La question du tissu cicatriciel reste ouverte sur le long terme, mais pour l'instant c'est un résultat sérieux.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic