Aller au contenu principal
RechercheLe Big Data4h· 2 min de lecture

Meta Brain2Qwerty v2 : L’IA qui traduit vos pensées en texte sans implant cérébral

Source originale ↗·

Meta a présenté Brain2Qwerty v2, une version améliorée de son système de décodage cérébral capable de transformer des signaux neuronaux en texte tapé, sans aucune intervention chirurgicale. Pour fonctionner, le dispositif s'appuie sur un scanner MEG (magnétoencéphalographie) porté sur la tête, qui capte les infimes champs magnétiques produits par l'activité cérébrale pendant que l'utilisateur imagine taper sur un clavier. À la différence de la première version, qui décodait les lettres une par une, Brain2Qwerty v2 est capable d'interpréter des caractères, des mots et des phrases entières simultanément, grâce à une combinaison de Transformers, de réseaux neuronaux convolutifs et de grands modèles de langage agissant comme un correcteur contextuel. Le modèle a été entraîné sur environ 22 000 phrases produites par neuf volontaires, chacun ayant passé près de dix heures sous scanner. Résultat : une précision moyenne de 61 % dans la reconnaissance des mots, avec un pic à 78 % pour le meilleur participant et plus de la moitié des phrases décodées comportant une seule erreur.

Pour les personnes atteintes de paralysie ou privées de la parole, cette avancée représente une piste sérieuse vers une communication autonome sans chirurgie. Les interfaces cerveau-ordinateur les plus précises, comme celles de Neuralink, nécessitent des électrodes implantées directement dans le cortex, avec tous les risques opératoires que cela implique. Brain2Qwerty v2 démontre qu'une approche entièrement non invasive peut produire des résultats comparables, même si les taux de précision restent encore en deçà des systèmes implantés. Pour l'industrie neurotechnologique au sens large, ce résultat déplace les lignes : il prouve que la précision de lecture cérébrale n'est pas l'apanage exclusif des implants, et ouvre un axe de recherche distinct.

Meta s'inscrit dans une course technologique qui réunit des acteurs très différents : Neuralink côté implants, BrainGate pour la recherche académique, et désormais Meta sur le segment non invasif. L'entreprise a choisi de publier en open source le code d'entraînement et l'ensemble de données, une décision qui devrait accélérer les travaux d'autres laboratoires. Les obstacles restent néanmoins considérables : les scanners MEG sont des équipements encombrants, extrêmement coûteux et confinés aux environnements de recherche. Aucune perspective de produit grand public n'est envisageable à court terme. Mais le signal envoyé est clair : les interfaces cerveau-ordinateur sans chirurgie cessent d'être de la science-fiction pour devenir un domaine d'ingénierie à part entière, et Meta entend y jouer un rôle central.

Impact France/UE

La mise en open source du code d'entraînement et des données pourrait accélérer les travaux des laboratoires européens en neurotechnologie, sans impact direct identifiable sur la France ou l'UE à court terme.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Atteint de SLA, il est le premier grand utilisateur d'un implant cérébral qui lui permet de parler
1MIT Technology Review 

Atteint de SLA, il est le premier grand utilisateur d'un implant cérébral qui lui permet de parler

Casey Harrell, 45 ans au moment des faits, atteint de sclérose latérale amyotrophique (SLA) et entièrement paralysé, est devenu le premier "power user" d'un implant cérébral destiné à restaurer la parole. En juillet 2023, une équipe de l'Université de Californie à Davis, dirigée par David Brandman, professeur associé de neurochirurgie, lui a implanté quatre réseaux de 64 électrodes chacun dans le cerveau, reliés à deux points de connexion fixés sur le crâne. Dès août 2023, un mois après l'opération, Harrell communiquait avec un vocabulaire de 50 mots et un taux de précision de 99,6 %. Ce vocabulaire a depuis été étendu à 125 000 mots, avec une précision de 97,5 %. Sur les 22,6 premiers mois suivant l'implantation, il a utilisé le dispositif plus de 3 800 heures à domicile sans la présence de chercheurs, selon une étude publiée cette semaine dans la revue Nature Medicine. L'avancée la plus significative tient à l'autonomie croissante de Harrell. En 2023, des membres de l'équipe devaient encore se rendre physiquement chez lui pour connecter et déconnecter l'appareil. Aujourd'hui, son soignant effectue seul cette opération : Harrell se réveille, est branché, et commence sa journée. Il surfe sur le web et exerce son travail grâce à l'interface. "Vivre avec une maladie comme la SLA, on est censé avoir des rêves diminués. Ce n'est pas mon cas", confie-t-il au MIT Technology Review. Cette autonomie est décisive : elle démontre qu'un tel dispositif peut fonctionner efficacement sur le long terme hors cadre clinique, et qu'un patient gravement atteint peut s'en emparer comme d'un véritable outil quotidien. Le système repose sur le décodage du cortex moteur de la parole, la région cérébrale qui coordonne les mouvements nécessaires à l'articulation. En enregistrant l'activité neuronale liée aux 39 phonèmes de l'anglais américain, les algorithmes construisent un décodeur personnalisé qui convertit les signaux cérébraux en parole synthétisée. L'une des grandes incertitudes des interfaces cerveau-ordinateur (BCI) à long terme est la formation de tissu cicatriciel autour des électrodes, susceptible de dégrader la captation des signaux neuronaux. Ce phénomène ne semble pas affecter Harrell à ce stade, ce qui est en soi un résultat encourageant. La SLA touche environ 30 000 personnes aux États-Unis. Des acteurs comme Neuralink et Synchron travaillent également sur des BCI humains, mais la durabilité et l'autonomisation démontrées par le cas Harrell constituent un jalon concret vers des dispositifs cliniquement viables, utilisables au quotidien par des patients en dehors de tout laboratoire.

💬 125 000 mots, 97,5 % de précision, 3 800 heures d'usage autonome à domicile. Ce qui me frappe, c'est pas la performance du décodeur, c'est que Casey Harrell se lève le matin, se branche, et commence sa journée comme tu commences la tienne. La question du tissu cicatriciel reste ouverte sur le long terme, mais pour l'instant c'est un résultat sérieux.

RecherchePaper
1 source
Meta TRIBE v2 : la première IA qui simule les réactions du cerveau humain
2Le Big Data 

Meta TRIBE v2 : la première IA qui simule les réactions du cerveau humain

Meta a présenté le 26 mars 2026 TRIBE v2 (Trimodal Brain Encoder), un modèle d'intelligence artificielle open source capable de prédire l'activité cérébrale humaine en réponse à une image, un son ou un texte. Entraîné sur plus de 500 heures d'enregistrements IRM fonctionnelle issus de plus de 700 participants, le modèle simule l'activation de près de 70 000 voxels cérébraux — des unités tridimensionnelles qui traduisent les variations de flux sanguin dans le cerveau. Son architecture repose sur trois étages : des encodeurs spécialisés par modalité (V-JEPA pour la vision, Wav2Vec2-BERT pour l'audio, Llama 3.x pour le texte), un module Transformer qui aligne ces signaux dans le temps pour tenir compte du délai entre perception et activation cérébrale, puis une couche de projection qui produit une carte prédictive des activations. Les performances annoncées sont deux à trois fois supérieures aux approches antérieures, et le modèle fonctionne en zero-shot : il prédit l'activité d'un nouveau sujet sans recalibrage individuel préalable, ce qui est rare dans ce domaine. Cette capacité de généralisation change la donne pour la recherche en neurosciences cognitives. Jusqu'ici, tout travail d'exploration cérébrale exigeait un accès à un scanner IRM, une infrastructure lourde et coûteuse. TRIBE v2 ouvre la possibilité de simuler des réponses cérébrales à grande échelle, à partir de n'importe quel contenu numérique, sans contrainte matérielle. Pour les chercheurs en perception sensorielle, en troubles cognitifs ou en interfaces cerveau-machine, cela représente un accélérateur potentiel considérable. Dans l'industrie, le modèle pourrait être utilisé pour évaluer l'impact attentionnel d'un contenu publicitaire, d'une interface ou d'un environnement sonore — des applications qui posent déjà des questions éthiques sur l'usage de modèles prédictifs du comportement cérébral. TRIBE v2 s'inscrit dans une trajectoire entamée avec la première version du modèle, qui avait remporté l'Algonauts 2025 Brain Encoding Challenge, une compétition internationale de référence sur la prédiction de l'activité cérébrale. Meta franchit ici une étape qualitative en passant d'un modèle sujet-spécifique à un modèle généraliste, capable de capturer des régularités cérébrales communes à travers une population large et diversifiée. La décision de publier TRIBE v2 en open source reflète la stratégie globale de Meta AI en matière de recherche fondamentale : rendre les outils disponibles à la communauté scientifique pour accélérer l'adoption et positionner l'entreprise comme acteur central de l'IA cognitive. Reste à voir comment la communauté s'emparera de ces capacités, et quels garde-fous encadreront des usages potentiellement intrusifs de la modélisation cérébrale prédictive.

UELes chercheurs européens en neurosciences cognitives peuvent accéder librement à TRIBE v2 pour simuler des réponses cérébrales à grande échelle sans infrastructure IRM, ouvrant de nouvelles perspectives pour la recherche sur les troubles cognitifs et les interfaces cerveau-machine.

💬 Le zero-shot sur des prédictions d'activité cérébrale, c'est le truc qui m'impressionne ici, pas la com' de Meta. Jusqu'ici, tout modèle de ce genre demandait un recalibrage par sujet, une IRM, une infra complète — là, tu balances un contenu, le modèle te sort une carte d'activation sans scanner. La question c'est pas si la recherche en neurosciences va s'en emparer, c'est si les équipes pub' vont l'utiliser avant elles.

RecherchePaper
1 source
Décodage cérébral MEG de bout en bout via NeuralSet et apprentissage profond pour prédire les traits linguistiques
3MarkTechPost 

Décodage cérébral MEG de bout en bout via NeuralSet et apprentissage profond pour prédire les traits linguistiques

Des chercheurs en neuroIA ont publié un tutoriel détaillant la construction d'un pipeline complet de décodage cérébral à partir de signaux MEG (magnétoencéphalographie), une technique d'imagerie cérébrale non invasive qui mesure les champs magnétiques produits par l'activité électrique des neurones. L'objectif concret du projet : prédire la longueur des mots qu'une personne lit ou entend, uniquement à partir des signaux cérébraux bruts, sans aucun autre indice. Pour y parvenir, l'équipe s'appuie sur deux bibliothèques Python dédiées, NeuralSet et NeuralFetch, couplées à PyTorch pour l'entraînement d'un réseau de neurones convolutif (CNN). Le pipeline transforme les données MEG en événements temporels structurés, extrait des caractéristiques linguistiques via un extracteur personnalisé nommé CharCount, puis entraîne le modèle à reconnaître les patterns spatiaux et temporels associés au traitement du langage dans le cerveau. Ce type de pipeline représente une avancée méthodologique importante pour la recherche en interface cerveau-machine, un domaine jusqu'ici freiné par la complexité de traitement des signaux neuronaux bruts. En proposant un workflow modulaire et reproductible, avec gestion des dépendances, graine aléatoire fixée pour la reproductibilité, et catalogage automatique des jeux de données MEG disponibles, les auteurs offrent aux équipes de recherche une base de travail standardisée. L'enjeu pratique est considérable : décoder des features linguistiques à partir d'activité cérébrale ouvre la voie à des systèmes de communication pour des patients atteints de paralysie ou de maladies neurodégénératives comme la SLA, sans implants chirurgicaux invasifs. Ce projet s'inscrit dans une dynamique plus large qui voit la neuroIA attirer des investissements massifs et des équipes de recherche de premier plan. Meta AI a démontré en 2023 qu'il était possible de décoder la parole perçue à partir de signaux MEG avec une précision inédite grâce à des architectures Transformer. OpenAI, DeepMind et plusieurs startups spécialisées comme Synchron ou Precision Neuroscience explorent parallèlement des approches invasives via des électrodes corticales. La particularité de l'approche MEG non invasive est qu'elle ne nécessite pas d'intervention chirurgicale, mais elle souffre d'une résolution spatiale plus faible que les implants. L'utilisation de CNN pour capturer les structures spatio-temporelles des signaux MEG reste un compromis efficace, et la publication de frameworks open source comme NeuralSet devrait accélérer la standardisation des protocoles expérimentaux, facilitant la comparaison entre études et la montée en puissance de modèles de décodage plus robustes dans les années à venir.

RecherchePaper
1 source
MaxToki : l'IA qui prédit comment vos cellules vieillissent et comment l'éviter
4MarkTechPost 

MaxToki : l'IA qui prédit comment vos cellules vieillissent et comment l'éviter

Une équipe internationale de chercheurs, impliquant notamment les Instituts Gladstone (maladies cardiovasculaires, neurologiques, sciences des données) et l'Université de Californie San Francisco, a développé MaxToki, un modèle d'intelligence artificielle capable de prédire l'évolution dans le temps de l'état génétique des cellules humaines. Contrairement aux modèles existants qui analysent les cellules comme des instantanés figés, MaxToki intègre une dimension temporelle, essentielle pour comprendre comment les cellules vieillissent. Le modèle repose sur une architecture de type transformer décodeur -- la même famille que les grands modèles de langage -- et a été entraîné sur des données de séquençage d'ARN unicellulaire. Il existe en deux versions : 217 millions et 1 milliard de paramètres. Son entraînement s'est déroulé en deux étapes, la première s'appuyant sur Genecorpus-175M, un corpus d'environ 175 millions de transcriptomes unicellulaires issus de 10 795 jeux de données publics, générant quelque 290 milliards de tokens. Une particularité technique clé est l'encodage par rang : plutôt que d'injecter des comptages bruts d'expression génique, chaque cellule est représentée par une liste de gènes classés selon leur expression relative, ce qui rend le modèle plus robuste face aux biais techniques des données biologiques. MaxToki ouvre des perspectives concrètes dans l'étude du vieillissement cellulaire et des maladies qui en découlent -- insuffisance cardiaque, maladie d'Alzheimer, fibrose pulmonaire -- des pathologies qui se développent sur des décennies à travers des changements progressifs dans les réseaux de gènes. Pouvoir modéliser ces trajectoires, et non plus seulement l'état instantané d'une cellule, représente un saut qualitatif pour la recherche biomédicale. La capacité à prédire "où va" une cellule pourrait accélérer l'identification de cibles thérapeutiques et la mise au point d'interventions capables de ralentir ou d'inverser ces processus dégénératifs, avant même l'apparition de symptômes cliniques. Le projet s'inscrit dans une vague plus large de fondation models appliqués à la biologie, une discipline où des acteurs comme NVIDIA (partenaire de ce projet), Google avec son modèle Evo, et plusieurs startups de biotech cherchent à reproduire le succès des LLMs dans le domaine du vivant. La plupart des modèles existants peinent à capturer la dynamique temporelle des systèmes biologiques, limitant leur utilité pour les maladies chroniques. MaxToki répond à ce manque en étendant notamment sa fenêtre de contexte de 4 096 à 16 384 tokens via la technique RoPE scaling, et en excluant délibérément les cellules cancéreuses et lignées immortalisées de l'entraînement pour ne pas biaiser l'apprentissage des dynamiques normales. Des institutions allemandes (Goethe University Frankfurt, Centre allemand de recherche cardiovasculaire) et japonaises (Université de Kyoto, Centre iPS) contribuent également, signe que la course aux modèles fondationnels en biologie est désormais pleinement internationale.

UEDes institutions allemandes (Goethe University Frankfurt, Centre allemand de recherche cardiovasculaire) participent au projet, positionnant l'Europe comme contributeur dans la course aux modèles fondationnels biologiques.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic