Biblioteca122.739 documentos en línea

Artículo

Reinforcement Learning Guided by Double Replay MemoryAprendizaje por refuerzo guiado por la doble memoria de repetición

Resumen

La memoria de repetición de experiencias en el aprendizaje por refuerzo permite a los agentes recordar y reutilizar experiencias pasadas. La mayoría de los modelos de refuerzo están sujetos a una única memoria de repetición de experiencias para el funcionamiento de los agentes. En este artículo, proponemos un marco que da cabida a la memoria de repetición de experiencias de doble uso, explotando tanto las transiciones importantes como las nuevas transiciones simultáneamente. En estudios numéricos, se examinan las redes Q profundas (DQN) equipadas con doble memoria de repetición de experiencias en varios escenarios. Un coche autoconducido requiere un agente automatizado que averigüe cuándo cambiar adecuadamente de carril en tiempo real. Para ello, aplicamos nuestro agente propuesto a los experimentos de simulación de movilidad urbana (SUMO). Además, también comprobamos su aplicabilidad al aprendizaje por refuerzo cuyo espacio de acción es discreto (por ejemplo, entornos de juegos de ordenador). En conjunto, concluimos que el marco propuesto supera a los modelos de aprendizaje por refuerzo conocidos hasta ahora en virtud de la doble memoria de repetición de experiencias.

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento