La memoria de repetición de experiencias en el aprendizaje por refuerzo permite a los agentes recordar y reutilizar experiencias pasadas. La mayoría de los modelos de refuerzo están sujetos a una única memoria de repetición de experiencias para el funcionamiento de los agentes. En este artículo, proponemos un marco que da cabida a la memoria de repetición de experiencias de doble uso, explotando tanto las transiciones importantes como las nuevas transiciones simultáneamente. En estudios numéricos, se examinan las redes Q profundas (DQN) equipadas con doble memoria de repetición de experiencias en varios escenarios. Un coche autoconducido requiere un agente automatizado que averigüe cuándo cambiar adecuadamente de carril en tiempo real. Para ello, aplicamos nuestro agente propuesto a los experimentos de simulación de movilidad urbana (SUMO). Además, también comprobamos su aplicabilidad al aprendizaje por refuerzo cuyo espacio de acción es discreto (por ejemplo, entornos de juegos de ordenador). En conjunto, concluimos que el marco propuesto supera a los modelos de aprendizaje por refuerzo conocidos hasta ahora en virtud de la doble memoria de repetición de experiencias.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Desarrollo preliminar de una metodología de suministro de CO2 a cultivos de Botryococcus Brauniipara la producción de biocombustibles
Artículo:
Estudio de Adsorción de Bach para la Extracción de Iones de Plata por Compuestos de Hidrazona de Solución Acuosa.
Artículo:
Estimación de la densidad de doble capa para la detección de múltiples instancias de objetos
Artículo:
Análisis del efecto de la aplicación del masaje de puntos de acupuntura abdominales sobre la intolerancia alimentaria en lactantes prematuros
Artículo:
Detección nocturna de vehículos en imágenes infrarrojas lejanas con aprendizaje profundo
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones