
Humanoid data
Les entreprises de robotique humanoïde ont lancé une course mondiale à la collecte de données de mouvement humain, convaincues que ces données sont la clé pour entraîner des robots capables de travailler aux côtés des humains, et un jour de les remplacer. Des applications rémunèrent désormais des particuliers en cryptomonnaie pour filmer des gestes du quotidien : réchauffer un plat au micro-ondes, remplir un bol, ouvrir une porte. D'autres plateformes proposent à des internautes de téléopérer à distance un bras robotique situé à Shenzhen, en Chine, pour lui faire résoudre des puzzles. Derrière ces dispositifs étranges se trouvent des investissements massifs : 6,1 milliards de dollars ont été injectés dans la seule filière des robots humanoïdes en 2025. Des centres d'entraînement spécialisés ont vu le jour en Chine, où des opérateurs portant des exosquelettes et des casques de réalité virtuelle répètent le même geste, essuyer une table, des centaines de fois par jour. Des travailleurs à la tâche au Nigeria, en Argentine et en Inde filment leurs corvées ménagères. Aux États-Unis, une entreprise de livraison a équipé ses employés de capteurs enregistrant leurs mouvements pendant le port de colis, avec un double objectif : prévenir les blessures et entraîner les robots qui pourraient les remplacer.
L'enjeu est considérable. Les humanoïdes présentent un avantage structurel sur les bras robotiques classiques : leur morphologie leur permet de s'intégrer directement dans des environnements conçus pour l'homme, des entrepôts aux cuisines industrielles. Mais les entraîner est autrement plus complexe. Les simulations informatiques, longtemps utilisées comme substitut aux données réelles, échouent à modéliser fidèlement les lois physiques du monde réel, friction, élasticité, résistance des matériaux, ce qui produisait des robots instables et maladroits. La collecte de données de mouvement en conditions réelles est censée combler ce fossé, en offrant aux algorithmes la même richesse empirique que les textes du web ont fournie aux grands modèles de langage depuis le lancement de ChatGPT fin 2022.
Ce modèle de collecte s'est imposé progressivement. Les premières tentatives, menées dans des laboratoires académiques, étaient artisanales : des chercheurs filmaient des volontaires en train de faire des crêpes ou de ranger leur bureau, et partageaient les données librement. Avec l'afflux de capital-risque, la course est devenue industrielle et opaque. La question centrale reste pourtant ouverte : personne ne sait encore combien de milliers de clips d'un micro-ondes ouvert sont nécessaires pour qu'un robot apprenne à cuisiner un repas complet, ni si cette approche peut atteindre l'échelle requise pour déclencher de véritables avancées techniques. Ce que cette dynamique dessine déjà, c'est une nouvelle catégorie de travail physique : celle du laboureur humain qui, avant d'être remplacé par une machine, aura servi à l'entraîner.




