El problema del control autoadaptativo del tráfico urbano es dinámico e incierto, por lo que los estados del entorno del tráfico son difíciles de observar. Un agente eficiente que controle una única intersección puede descubrirse automáticamente mediante el aprendizaje por refuerzo multiagente. Sin embargo, en la mayoría de los trabajos anteriores sobre este enfoque, cada agente necesitaba información observada perfecta cuando interactuaba con el entorno y aprendía individualmente con una coordinación menos eficiente. Este estudio plantea el control autoadaptativo del tráfico como un problema de juego de Markov multiagente. El diseño emplea un agente de control de señales de tráfico (TSCA) para cada intersección señalizada que se coordina con los TSCA vecinos. Se construye un modelo matemático para la interacción de los TSCA basado en un juego de Markov de suma no nula que se ha aplicado para que los TSCA aprendan a cooperar. Sobre la base del aprendizaje Q de un solo agente, se construye un método de aprendizaje reforzado de juegos de Markov multiagente. Este método permite que cada TSCA aprenda a actualizar sus valores Q bajo las acciones conjuntas y la información imperfecta. Se analiza teóricamente la convergencia del algoritmo propuesto. Los resultados de la simulación muestran que el método propuesto es convergente y eficaz en un entorno realista de control autoadaptativo del tráfico.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Una red neuronal recurrente de una capa para resolver la optimización pseudoconvexa con restricciones de conjunto de cajas
Artículo:
Análisis de la evolución espacio-temporal y factores que influyen en la red de transporte de carga en la región media del río Yangtsé.
Artículo:
Alcanzando la norma en formas multilineales
Artículo:
Diseño de un Controlador de Estructura Variable Integral en el Seguimiento de Velocidad de un Generador Eólico.
Artículo:
Extensión sobre las Bifurcaciones de Soluciones de Ondas Viajeras para una Ecuación de Fornberg-Whitham de Dos Componentes
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo