El problema del control autoadaptativo del tráfico urbano es dinámico e incierto, por lo que los estados del entorno del tráfico son difíciles de observar. Un agente eficiente que controle una única intersección puede descubrirse automáticamente mediante el aprendizaje por refuerzo multiagente. Sin embargo, en la mayoría de los trabajos anteriores sobre este enfoque, cada agente necesitaba información observada perfecta cuando interactuaba con el entorno y aprendía individualmente con una coordinación menos eficiente. Este estudio plantea el control autoadaptativo del tráfico como un problema de juego de Markov multiagente. El diseño emplea un agente de control de señales de tráfico (TSCA) para cada intersección señalizada que se coordina con los TSCA vecinos. Se construye un modelo matemático para la interacción de los TSCA basado en un juego de Markov de suma no nula que se ha aplicado para que los TSCA aprendan a cooperar. Sobre la base del aprendizaje Q de un solo agente, se construye un método de aprendizaje reforzado de juegos de Markov multiagente. Este método permite que cada TSCA aprenda a actualizar sus valores Q bajo las acciones conjuntas y la información imperfecta. Se analiza teóricamente la convergencia del algoritmo propuesto. Los resultados de la simulación muestran que el método propuesto es convergente y eficaz en un entorno realista de control autoadaptativo del tráfico.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estrategia de Arresto Basada en Redes Criminales Dinámicas que Cambian con el Tiempo
Artículo:
Aproximaciones superiores para estudiar las características estadísticas de las ondas en medios inhomogéneos multiescala.
Artículo:
Epi--Normalidad y Epi--Normalidad
Artículo:
Esquema de Diferencias Conservativas para la Ecuación Generalizada de Rosenau-KdV
Artículo:
Un teorema único de punto fijo común acoplado para aplicaciones simétricas contractivas en espacios métricos ordenados con aplicaciones.