
Stratégie de planification par apprentissage coopératif autonome intégrant l'incertitude
Des chercheurs ont publié sur arXiv un nouveau cadre algorithmique baptisé DRLACP (Deep Reinforcement Learning-based Autonomous Cooperative Planning), conçu pour améliorer la coordination entre véhicules autonomes dans des environnements de circulation complexes. Le système s'appuie sur une combinaison de deux techniques d'apprentissage automatique : le Soft Actor-Critic (SAC), un algorithme d'apprentissage par renforcement réputé pour sa robustesse, et les Gate Recurrent Units (GRU), un type de réseau de neurones récurrents capable de traiter des séquences temporelles. Les performances du système ont été évaluées sur CARLA, une plateforme de simulation open-source largement utilisée dans la recherche sur la conduite autonome.
L'enjeu central est de traiter simultanément trois catégories d'incertitudes qui affectent les systèmes de planification coopérative actuels : les incertitudes de perception (données sensorielles imprécises ou manquantes), de planification (décisions sous information incomplète) et de communication (latences ou pertes de données entre véhicules). Les approches existantes ne parviennent généralement à gérer qu'une ou deux de ces sources d'erreur. Selon les auteurs, DRLACP surpasse les méthodes de référence testées dans plusieurs scénarios de simulation avec des informations d'état imparfaites, ce qui représente une avancée concrète pour la fiabilité des systèmes multi-véhicules.
La planification coopérative autonome est considérée comme une brique fondamentale des systèmes de transport intelligents de demain, où des flottes de véhicules doivent coordonner leurs trajectoires en temps réel pour maximiser fluidité et sécurité. La difficulté réside dans la nature distribuée de ces systèmes : chaque véhicule perçoit partiellement son environnement et communique avec ses voisins dans des conditions réseau variables. Les travaux sur DRLACP s'inscrivent dans une tendance plus large qui cherche à rendre ces algorithmes opérationnels hors des conditions idéales des laboratoires. La prochaine étape naturelle sera de valider ces résultats sur des données réelles et dans des scénarios urbains plus denses que ceux testés en simulation.
Contribution académique indirectement pertinente pour l'industrie automobile européenne (Stellantis, Renault, Volkswagen) engagée dans la conduite coopérative, mais les résultats restent cantonnés à la simulation CARLA et sont loin d'un déploiement industriel.




