El control de intersecciones no señalizadas es una de las cuestiones más críticas en los sistemas de transporte inteligentes, que requieren vehículos conectados y automatizados para soportar una interacción más frecuente de información y computación a bordo. Resulta muy prometedor introducir el aprendizaje por refuerzo en el control de intersecciones no señalizadas. Sin embargo, los algoritmos de aprendizaje de refuerzo multiagente existentes, como el gradiente de política determinista profundo multiagente (MADDPG), difícilmente manejan un número dinámico de vehículos, lo que no puede satisfacer la necesidad de las condiciones reales de la carretera. Por lo tanto, este trabajo propone un MADDPG cooperativo (CoMADDPG) para vehículos conectados en intersecciones no señalizadas para resolver este problema. En primer lugar, el escenario de múltiples vehículos que pasan a través de una intersección no señalizada se formula como un problema de aprendizaje de refuerzo multiagente (RL). En segundo lugar, MADDPG se redefine para adaptarse a los agentes de cantidad dinámica, donde cada vehículo selecciona vehículos de referencia para construir un entorno estacionario parcial, que es necesario para RL. En tercer lugar, este trabajo incorpora un novedoso método de selección de vehículos, que proyecta los vehículos de referencia en un carril virtual y selecciona los vehículos de mayor impacto para construir el entorno. Por último, se desarrolla una plataforma de simulación de intersecciones para evaluar el método propuesto. De acuerdo con los resultados de la simulación, CoMADDPG puede reducir el tiempo medio de viaje en un 39,28 en comparación con los otros métodos basados en la optimización, lo que indica que CoMADDPG tiene una excelente perspectiva para hacer frente al escenario de control de intersecciones no señalizadas.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Resolubilidad para una nueva clase de ecuación de Moore-Gibson-Thompson con memoria viscoelástica, términos fuente y condición integral.
Artículo:
El Mapeo Conformal de Schwarz-Christoffel para "Polígonos" con Infinitos Lados
Artículo:
Clasificación de imágenes hiperespectrales mediante la transformada kernel Fukunaga-Koontz
Artículo:
Un algoritmo de juego ficticio para juegos de matriz con pagos difusos.
Artículo:
Generalización geométrica de la optimización basada en modelos sustitutos a espacios combinatorios y de programas
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones