El control de intersecciones no señalizadas es una de las cuestiones más críticas en los sistemas de transporte inteligentes, que requieren vehículos conectados y automatizados para soportar una interacción más frecuente de información y computación a bordo. Resulta muy prometedor introducir el aprendizaje por refuerzo en el control de intersecciones no señalizadas. Sin embargo, los algoritmos de aprendizaje de refuerzo multiagente existentes, como el gradiente de política determinista profundo multiagente (MADDPG), difícilmente manejan un número dinámico de vehículos, lo que no puede satisfacer la necesidad de las condiciones reales de la carretera. Por lo tanto, este trabajo propone un MADDPG cooperativo (CoMADDPG) para vehículos conectados en intersecciones no señalizadas para resolver este problema. En primer lugar, el escenario de múltiples vehículos que pasan a través de una intersección no señalizada se formula como un problema de aprendizaje de refuerzo multiagente (RL). En segundo lugar, MADDPG se redefine para adaptarse a los agentes de cantidad dinámica, donde cada vehículo selecciona vehículos de referencia para construir un entorno estacionario parcial, que es necesario para RL. En tercer lugar, este trabajo incorpora un novedoso método de selección de vehículos, que proyecta los vehículos de referencia en un carril virtual y selecciona los vehículos de mayor impacto para construir el entorno. Por último, se desarrolla una plataforma de simulación de intersecciones para evaluar el método propuesto. De acuerdo con los resultados de la simulación, CoMADDPG puede reducir el tiempo medio de viaje en un 39,28 en comparación con los otros métodos basados en la optimización, lo que indica que CoMADDPG tiene una excelente perspectiva para hacer frente al escenario de control de intersecciones no señalizadas.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Propiedades algebraicas de los operadores de Toeplitz cuasihomogéneos y separadamente cuasihomogéneos en el espacio de Bergman pluriarmónico.
Artículo:
Análisis cualitativo del efecto de la eliminación de malas hierbas en los ecosistemas de arrozales en la temporada de barbecho.
Artículo:
Caracterización de la Transformada de Riesz de Espacios de Hardy Ponderados Asociados con Operadores de Schrödinger
Artículo:
Resolviendo problemas singulares de valores de contorno de dos puntos utilizando el algoritmo genético continuo.
Artículo:
Solución numérica de ecuaciones diferenciales difusas de segundo orden utilizando el método Runge-Kutta Nystrom mejorado