Aller au contenu principal
L'IA de conduite autonome entraînée 50 000 fois plus vite qu'en temps réel
RobotiqueIEEE Spectrum AI13sem· 2 min de lecture

L'IA de conduite autonome entraînée 50 000 fois plus vite qu'en temps réel

Source originale ↗·

General Motors franchit une nouvelle étape dans la course à la conduite autonome en dévoilant une approche d'entraînement de ses IA capable de simuler des scénarios de conduite 50 000 fois plus vite qu'en temps réel. L'enjeu : préparer les systèmes autonomes à gérer non pas les situations ordinaires, mais les cas limites rares et imprévisibles qui déterminent en définitive la fiabilité d'un véhicule sans conducteur.

Le défi fondamental de la conduite autonome n'est pas de gérer 99 % des situations courantes — celles-ci sont relativement bien résolues — mais ce que les ingénieurs appellent la "longue traîne" : un matelas sur la chaussée, une panne généralisée des feux de circulation, un agent de la circulation dont le geste manuel contredit un feu rouge. Ces événements sont rares, mais leur gestion incorrecte peut être fatale. Pour GM, c'est précisément sur ce terrain que se joue la bataille de l'autonomie réelle, notamment en vue du déploiement de la conduite "mains libres sur autoroute" et, à terme, de véhicules entièrement autonomes.

Pour y répondre, GM combine plusieurs technologies de pointe. D'abord, des modèles Vision Language Action (VLA) — des modèles de langage visuel adaptés à la conduite, capables de reconnaître des gestes policiers ou d'interpréter la signalétique improvisée d'un chantier. Pour contourner le problème de latence inhérent à ces grands modèles, GM a développé une architecture dite "Dual Frequency VLA" : un grand modèle tourne à basse fréquence pour les décisions sémantiques complexes ("est-ce une branche ou un parpaing ?"), tandis qu'un modèle léger et rapide gère en temps réel le contrôle physique du véhicule (direction, freinage). L'ensemble est entraîné via de la simulation haute-fidélité et du reinforcement learning à une échelle impossible à atteindre sur route réelle.

Cette approche positionne GM comme l'un des acteurs les plus méthodiques du secteur, à rebours des stratégies purement basées sur les kilomètres réels accumulés. En rendant les raisonnements du modèle explicables via des traces de déduction, l'entreprise mise aussi sur la validation réglementaire et la confiance des opérateurs de sécurité — un avantage stratégique non négligeable à mesure que les autorités durcissent leur regard sur les systèmes autonomes.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

SwarmDrive : coordination sémantique V2V pour la conduite autonome coopérative en temps contraint
1arXiv cs.RO 

SwarmDrive : coordination sémantique V2V pour la conduite autonome coopérative en temps contraint

Des chercheurs ont présenté SwarmDrive, un système de coordination sémantique véhicule-à-véhicule (V2V) pensé pour la conduite autonome sous contrainte de latence. Chaque véhicule du réseau embarque un petit modèle de langage local (SLM) et ne partage ses intentions avec les véhicules voisins que lorsque son niveau d'incertitude dépasse un seuil défini, limitant ainsi les échanges au strict nécessaire. Les données partagées sont fusionnées via un mécanisme de consensus déclenché par événement. Dans une étude en cinq configurations autour d'un scénario d'intersection obstruée, le système en mode 6G a porté le taux de succès de 68,9 % à 94,1 % par rapport à un SLM local seul. La latence chute dans le même temps de 510 ms (référence cloud) à 151,4 ms. Les performances optimales ont été mesurées avec un essaim de 4 véhicules actifs et un seuil d'entropie de 0,65 ; au-delà, la charge réseau et les pertes de paquets augmentent sensiblement. Ces résultats s'attaquent à un problème central de la conduite autonome : les modèles hébergés dans le cloud sont puissants mais introduisent des délais incompatibles avec des décisions de sécurité en temps réel, tandis que les modèles locaux peinent à raisonner correctement face aux angles morts physiques. SwarmDrive propose une troisième voie, coopérative, où plusieurs véhicules proches mutualisent leur intelligence de façon légère et ciblée, sans dépendre d'une connexion permanente à un serveur distant. Pour les constructeurs et les développeurs de systèmes ADAS, c'est une approche prometteuse pour naviguer dans des environnements urbains complexes où les occultations sont fréquentes. La coordination véhicule-à-véhicule n'est pas nouvelle, au coeur de standards comme le C-V2X, mais l'intégration de modèles de langage dans la boucle de décision embarquée en renouvelle les usages. SwarmDrive mise sur deux tendances convergentes : la miniaturisation des modèles IA et les promesses de la 6G en matière de latence ultra-faible. Les auteurs préviennent toutefois que l'étude reste un prototype sur un scénario unique, et non une validation de déploiement réel sur une infrastructure 6G opérationnelle. L'étape suivante sera de tester la robustesse du système dans des environnements plus variés et avec des flottes plus denses, où la scalabilité de la communication deviendra un obstacle critique.

UELes constructeurs automobiles européens (Renault, Stellantis) et les acteurs du standard C-V2X pourraient s'appuyer sur cette approche pour renforcer la coopération embarquée dans leurs prototypes de véhicules autonomes, notamment dans le cadre des programmes 6G européens.

RobotiquePaper
1 source
Les recherches de NVIDIA ouvrent la voie à la préhension avancée, la conduite autonome et l'entraînement d'agents à grande échelle
2NVIDIA AI Blog 

Les recherches de NVIDIA ouvrent la voie à la préhension avancée, la conduite autonome et l'entraînement d'agents à grande échelle

NVIDIA Research présente cette semaine au CVPR 2026 trois nouveaux papiers de recherche qui partagent une ambition commune : entraîner des systèmes à grande échelle pour qu'ils généralisent au-delà de leurs cas d'usage initiaux. Le premier, GraspGen-X, est décrit comme le premier modèle fondamental pour la saisie robotique zéro-shot : entraîné sur deux milliards de saisies simulées couvrant des milliers de formes d'objets et de configurations de pinces, il est capable de générer des propositions de prise fiables pour n'importe quelle pince robotique, y compris des modèles qu'il n'a jamais rencontrés. Le deuxième papier, LCDrive, introduit une approche pour la conduite autonome qui remplace le raisonnement textuel par des représentations latentes compactes, permettant aux véhicules de raisonner plus vite sur le matériel embarqué réel. Enfin, NitroGen est un modèle fondamental d'IA de gameplay, construit sur l'architecture NVIDIA Isaac GR00T, qui aide à entraîner des agents incarnés dans des environnements virtuels sur des dizaines de milliers d'heures d'interaction. Ces trois travaux répondent à des verrous concrets qui freinent le déploiement de l'IA physique aujourd'hui. Pour la robotique, le problème était simple mais paralysant : chaque nouveau type de pince nécessitait un cycle complet de collecte de données, fine-tuning et validation. GraspGen-X élimine ce goulot d'étranglement en fonctionnant comme un grand modèle de langage appliqué à la géométrie, utilisable directement avec les pinces courantes sans réentraînement. En parallèle, LCDrive adresse une contrainte matérielle réelle des véhicules autonomes : le raisonnement par chaîne de pensée basé sur du texte génère des tokens qui coûtent du temps de calcul, un luxe que les processeurs embarqués dans les voitures ne peuvent pas se permettre en situation réelle. En remplaçant les mots par des représentations latentes, le système peut raisonner plus vite sur le même hardware. Ces annonces s'inscrivent dans une dynamique plus large chez NVIDIA, qui positionne l'IA physique comme le prochain grand chantier après les LLM. La conférence CVPR, l'une des plus importantes en vision par ordinateur, est un terrain de choix pour valider ces approches auprès de la communauté académique avant leur adoption industrielle. GraspGen-X s'intègre d'ailleurs avec curoboV2, une nouvelle bibliothèque de planification de mouvement accélérée par CUDA, et s'appuie sur des travaux antérieurs comme Grasp-MPC présenté à l'ICRA 2026. Pour les développeurs de robots et de véhicules autonomes, l'enjeu est de taille : réduire les cycles de développement grâce à des modèles fondamentaux capables de s'adapter à de nouveaux contextes sans repartir de zéro, une approche qui commence à prouver sa valeur dans le monde du langage et que NVIDIA ambitionne désormais d'imposer dans le monde physique.

UELes avancées en préhension robotique zéro-shot et en inférence embarquée pour véhicules autonomes pourraient bénéficier aux industriels européens de la robotique et de l'automobile cherchant à réduire les cycles de développement.

RobotiquePaper
1 source
Kakao Mobility dévoile sa feuille de route pour la conduite autonome de niveau 4
3AI News 

Kakao Mobility dévoile sa feuille de route pour la conduite autonome de niveau 4

Kakao Mobility, la filiale mobilité du groupe sud-coréen Kakao, a présenté sa feuille de route pour le développement en interne de technologies de conduite autonome de niveau 4. Kim Jin-kyu, vice-président et directeur de la division Physical AI de l'entreprise, a détaillé ce plan lors du World IT Show 2026, organisé au centre de conférences COEX de Séoul, un événement réunissant 460 entreprises et organisations issues de 17 pays. La stratégie repose sur trois piliers technologiques : des modèles de machine learning capables de gérer la perception, la prise de décision et le contrôle du véhicule sans intervention humaine ; des architectures de véhicules avec systèmes redondants garantissant la continuité des fonctions critiques en cas de défaillance d'un composant ; et une plateforme de validation combinant simulations virtuelles et données de conduite réelle. En parallèle, Kakao Mobility développe un outil de visualisation 3D appelé Autonomous Vehicle Visualizer, qui retransmet en temps réel le champ de vision du véhicule aux passagers, ainsi qu'un centre de contrôle opérationnel 24h/24 et un système de détection d'anomalies basé sur des modèles vision-langage pour permettre une intervention à distance en cas d'urgence. La conduite autonome de niveau 4, telle que définie par la National Highway Traffic Safety Administration américaine, désigne des systèmes capables d'assurer l'intégralité de la conduite dans des zones de service délimitées sans que les passagers n'aient à surveiller la route ni reprendre le contrôle. Atteindre ce seuil représente un enjeu industriel majeur : c'est à ce stade que les services de taxi sans conducteur deviennent commercialement viables à grande échelle. Pour Kakao Mobility, qui opère déjà un service de véhicules autonomes en soirée dans le quartier de Gangnam à Séoul, cette feuille de route vise à transformer son infrastructure de mobilité existante en fondation pour des services entièrement autonomes, et à renforcer la compétitivité locale de la Corée du Sud face aux acteurs mondiaux du secteur. Le gouvernement sud-coréen a d'ailleurs positionné le World IT Show 2026 comme un signal fort de sa transition vers une économie d'IA physique, où l'intelligence artificielle s'intègre directement aux infrastructures industrielles et urbaines. Dans ce contexte, Kakao Mobility entend ne pas rester un utilisateur de technologies développées ailleurs : l'entreprise prévoit de partager avec des startups, fabricants et partenaires industriels ses jeux de données de conduite autonome à grande échelle, ses cartes haute définition et ses API de plateforme pour le covoiturage et la dispatch. Cette stratégie d'écosystème ouvert cherche à éviter que chaque acteur du secteur reconstruise seul l'infrastructure de base, tout en positionnant Kakao comme orchestrateur central du marché autonome coréen.

RobotiqueActu
1 source
OpenPodcar2 : un véhicule ROS2 robuste pour la recherche en conduite autonome
4arXiv cs.RO 

OpenPodcar2 : un véhicule ROS2 robuste pour la recherche en conduite autonome

Une équipe de chercheurs vient de publier les spécifications complètes d'OpenPodcar2, une plateforme de véhicule autonome open source construite à partir d'un scooter de mobilité électrique du commerce, équipé d'un toit rigide. Ce projet, qui fait suite à une première version baptisée OpenPodcar, intègre désormais une électronique renforcée et une interface complète avec ROS2, le système d'exploitation robotique de référence. La plateforme repose sur trois composants principaux : des instructions de montage détaillées accompagnées d'une liste complète de matériaux, une intégration avec la carte mécatronique généraliste OSH R4 ainsi qu'un environnement de simulation Gazebo, et enfin des implémentations logicielles de haut niveau incluant la pile nav2, qui assure la cartographie autonome (SLAM) et le pilotage du véhicule entre deux positions en évitant les obstacles. Le coût total de construction est estimé à environ 7 000 dollars avec des composants neufs, ou 2 000 dollars en réutilisant un scooter d'occasion. Le véhicule peut transporter un passager humain ou une charge équivalente à une vitesse maximale de 15 km/h. L'intérêt d'OpenPodcar2 réside dans l'équilibre qu'il propose entre utilité réelle, sécurité, coût et robustesse, un compromis rarement atteint dans ce domaine. Concrètement, le véhicule est suffisamment compact pour être garé dans un laboratoire de recherche standard, tout en étant assez solide pour envisager des cas de déploiement réels, comme un service de taxi autonome dit "dernier kilomètre" ou le transport de conteneurs de livraison dans des centres-villes. Cela ouvre des perspectives directes pour les chercheurs qui cherchent à tester des algorithmes de navigation sur un vrai véhicule sans investir des centaines de milliers de dollars. Le projet s'inscrit dans une tendance plus large de démocratisation des plateformes de recherche en véhicules autonomes. La montée en puissance de ROS2 comme standard dans la robotique mobile a rendu possible des intégrations logicielles plus stables et interopérables qu'avec la génération précédente. En abaissant drastiquement le seuil d'accès matériel et logiciel, OpenPodcar2 pourrait permettre à des laboratoires universitaires disposant de budgets limités de mener des travaux qui étaient jusqu'ici réservés à des acteurs industriels ou à de grands centres de recherche. La publication complète des plans et du code source favorise également la reproductibilité scientifique et la collaboration communautaire autour de ces systèmes.

UELes laboratoires universitaires européens à budget limité pourraient adopter cette plateforme open source pour conduire des recherches en navigation autonome sans investissement matériel prohibitif.

RobotiqueActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic