Robotique — page 4

628 articles · page 4 sur 13

Actualités robotique et IA : robots autonomes, drones, véhicules autonomes et robots humanoïdes.

LLMs Recherche Business Éthique Outils Régulation Sécurité Société Infrastructure Création Autre

Genesis AI lance Nyx, Quadrants et Genesis World 1.0, une plateforme physique pour évaluer les modèles de robotique à grande échelle

Genesis AI a lancé Genesis World 1.0, une plateforme de simulation conçue pour accélérer le développement des modèles de fondation en robotique. La suite se compose de quatre éléments : un moteur physique, Nyx (un moteur de rendu par lancer de rayons en temps réel), Quadrants (un compilateur Python vers GPU), et une interface de simulation. Le problème que tente de résoudre cette plateforme est concret : évaluer une politique robotique sur une centaine de tâches avec plusieurs centaines d'épisodes chacune nécessite normalement plus de 200 heures de fonctionnement continu avec un opérateur humain et un seul robot. Genesis World 1.0 ramène cette même évaluation à moins de 30 minutes, sans intervention humaine ni matériel physique, avec une reproductibilité bit à bit des résultats. C'est un gain d'environ deux ordres de grandeur sur le temps de cycle d'évaluation. Ce bond de performance change fondamentalement la manière dont les équipes de recherche peuvent comparer des variantes de modèles. Jusqu'ici, la lenteur de l'évaluation réelle obligeait à faire des choix brutaux sur le nombre de checkpoints testés, biaisant de facto les décisions de développement. Genesis AI a délibérément choisi d'utiliser la simulation pour l'évaluation avant de l'utiliser pour la génération de données d'entraînement, et ce pour une raison méthodologique précise : si entraînement et évaluation partagent la même distribution simulée, un gain de performance peut simplement refléter une meilleure adaptation au simulateur, et non un progrès réel. L'approche retenue, baptisée "zero-shot real-to-sim", consiste à évaluer en simulation des politiques entraînées exclusivement sur des données réelles. Les résultats de corrélation sont probants : la corrélation de Pearson entre les performances en simulation et sur robot physique atteint 0,8996 (intervalle de confiance à 95 % : [0,7439 ; 0,9314]), calculée sur trois variantes de modèles (Small, Medium, Large), 14 tâches et 200 épisodes par tâche, avec un million d'itérations bootstrap. Le Mean Maximum Rank Violation (MMRV) s'établit à 0,0166, ce qui signifie que le simulateur préserve fidèlement le classement relatif des modèles entre eux. Genesis AI évolue dans un secteur en pleine structuration, où des acteurs comme Google DeepMind, Physical Intelligence ou encore Boston Dynamics investissent massivement dans les modèles de fondation pour la robotique généraliste. La qualité du simulateur est devenue un avantage compétitif direct : Genesis revendique un écart de réalité réduit de 45 % par rapport au meilleur simulateur concurrent, mesuré par le score FID sur leur jeu de données. Pour diagnostiquer précisément les sources de divergence simulation-réalité, l'équipe a construit un banc de test côte à côte permettant de faire fonctionner simultanément le simulateur et un robot physique depuis la même initialisation, en permutant les sources d'observations (caméra, proprioception) pour isoler si les écarts viennent de la physique, du rendu, des communications ou du contrôle. Nyx, le moteur de rendu intégré, vise des images 1080p sans bruit en moins de 4 millisecondes sur un GPU grand public haut de gamme, en s'appuyant sur le lancer de rayons matériel et des splats gaussiens 3D pour les zones où la reconstruction en maillage reste insuffisante.

Robotique — page 4

Genesis AI lance Nyx, Quadrants et Genesis World 1.0, une plateforme physique pour évaluer les modèles de robotique à grande échelle

Une startup forme des robots en envoyant des humains filmer le ménage chez vous

Cette startup IA nettoie votre maison gratuitement pour entraîner ses futurs robots

X-Square Robot dévoile WALL-WM, le premier modèle du monde à IA incarnée avec prédiction au niveau événementiel

PhAIL : un benchmark VLA sur robots réels et une méthodologie distributionnelle

Qwen-VLA : un modèle vision-langage-action (VLA) unifié pour les tâches, environnements et morphologies de robots

Quand un robot doit-il réfléchir ? Raisonnement adaptatif aux ressources par apprentissage par renforcement pour la prise de décision robotique

Apprentissage d'une politique visuelle par simulation pour l'insertion de cheville dans des trous inconnus en conditions réelles

La recherche NVIDIA montre que des robots entraînés en simulation peuvent accomplir des tâches réelles

NVIDIA Research fait progresser la robotique de la simulation au monde réel

Les VLA échouent différemment selon leur architecture : ce que révèle la surveillance en boîte noire

Comment apprendre aux robots : comparaison entre guidage kinesthésique, joystick et gestes

Tabero : manipulation douce par retour de force en boucle fermée (vision, toucher, langage)

Au-delà du binaire : manipulation dextérique sim-vers-réel avec représentation de contact fondée sur la physique

Champs d'action neuraux implicites : des points de passage discrets aux fonctions continues pour les modèles vision-langage-action (VLA)

CogVLA : un modèle vision-langage-action aligné sur la cognition par routage et sparsification guidés par instructions

ProgVLA : apprentissage de compétences de manipulation robotique guidé par la progression

AdaMorph : retargeting de mouvement unifié par transformeurs adaptatifs sensibles à l'incarnation

Des jambes humanoïdes imprimables en 3D pour libérer l'expérimentation en robotique

ANYbotics : l’entreprise porte le marché en avant de la robotique autonome

L’IA physique : le prochain marché que surveille déjà Wall Street

EXPO-FT : affinage par apprentissage par renforcement économe en données pour les modèles vision-langage-action (VLA)

SpecPrune-VLA : accélérer les modèles vision-langage-action via un élagage auto-spéculatif sensible aux actions

IsaacIPC : simulation haute fidélité et rendu réaliste couplés pour la robotique en contact

Échantillonnage guidé à l'inférence par un vérificateur de progression des tâches pour la manipulation robotique

La Chine donne une carte d’identité aux robots humanoïdes : Bientôt le droit de vote ?

Des robots autonomes dotés d'une perception précise de l'environnement réel grâce à une avancée d'ingénieurs américains

Agentic-VLA : adaptation en ligne efficace pour les modèles vision-langage-action

SCRIPT : politique de diffusion extensible, entraînement multi-étapes, contrôle physique d'humanoïdes par le langage

USIM et U0 : un jeu de données et un modèle vision-langage-action pour robots sous-marins polyvalents

Any2Any : transfert efficace entre plateformes pour le suivi corporel complet de robots humanoïdes

Mélange d'experts structuré sémantiquement pour la manipulation robotique compositionnelle

L'avenir de l'IA physique n'est pas humanoïde : il est spécialisé et rentable

Brain Corp et UC San Diego s'associent pour faire progresser la couche d'intelligence fondatrice pour l'IA physique

PGDG : génération de données physiquement ancrée pour l'apprentissage robuste de politiques bimanuelles à partir d'une seule démonstration

SONIC : un système de suivi du mouvement étendu pour le contrôle corporel intégral des humanoïdes

Pre-VLA : vérification préemptive à l'exécution pour fiabiliser les déroulements de modèles VLA et du monde

Action par primitives visuelles

GesVLA : représentations gestuelles intégrées pour un modèle vision-langage-action

Jarvis : ce robot barista prépare votre café à la perfection… sans pause café

Stellantis vise les longs trajets : la conduite mains libres arrive sur autoroute

L'avenir de l'IA physique passe par des interfaces plus intelligentes, pas des robots plus capables

Robot moonwalk façon Michael Jackson : le fiasco

Demo-JEPA : architecture prédictive à enchâssement conjoint pour l'imitation inter-robots en une seule démonstration

SUGAR : cadre d'apprentissage généralisable et extensible pour la loco-manipulation humanoïde par vidéos humaines

PointACT : des modèles vision-langage-action (VLA) avec interaction multi-échelle point-action

Manipulation corps entier des humanoïdes via un cerveau spatial actif et un cervelet d'action généralisable

Une entreprise chinoise accélère l'intelligence des robots humanoïdes avec un contrôle à 300 FPS

Des robots humanoïdes de Figure AI gèrent des colis sous le regard fasciné d'internet

Au-delà du succès binaire : un cadre de méta-évaluation diagnostique pour la manipulation fine