Estudiamos cómo autobuses inteligentes que sirven un circuito de paradas de autobús aprenden una estrategia de no abordaje y de espera mediante el aprendizaje por refuerzo. Las estrategias de no abordaje y de espera surgen de las acciones de los autobuses cuando están en una parada y todos los pasajeros que desean bajar lo han hecho. Una recompensa que alienta a los autobuses a esforzarse por lograr una diferencia de fase escalonada entre ellos mientras recogen pasajeros permite que el proceso de aprendizaje por refuerzo converja hacia una tabla Q óptima en un tiempo razonable de simulación. Es notable que este comportamiento emergente de los autobuses inteligentes logra minimizar el tiempo de espera promedio de los pasajeros, en diversas configuraciones donde los autobuses se mueven a la misma velocidad o a velocidades diferentes, tanto en períodos de alta demanda como en períodos de baja demanda. También se observan acciones cooperativas, por ejemplo, los autobuses aprenden a...
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Sistema de pago autónomo Pay-As-You-Go basado en IoT con la Cartera de Contratos
Artículo:
Resiliencia adaptativa al error para la transmisión de video
Artículo:
Investigación sobre la optimización de la línea de ensamblaje de automóviles basada en la tecnología de ingeniería industrial y algoritmos de aprendizaje automático.
Artículo:
Diseño, implementación y evaluación del rendimiento de esquemas eficientes de soporte al emisor de multidifusión móvil basados en PMIPv6
Artículo:
Un modelo multimodal profundo para predecir las respuestas afectivas evocadas por las películas basado en la segmentación de planos