La memoria de repetición de experiencias en el aprendizaje por refuerzo permite a los agentes recordar y reutilizar experiencias pasadas. La mayoría de los modelos de refuerzo están sujetos a una única memoria de repetición de experiencias para el funcionamiento de los agentes. En este artículo, proponemos un marco que da cabida a la memoria de repetición de experiencias de doble uso, explotando tanto las transiciones importantes como las nuevas transiciones simultáneamente. En estudios numéricos, se examinan las redes Q profundas (DQN) equipadas con doble memoria de repetición de experiencias en varios escenarios. Un coche autoconducido requiere un agente automatizado que averigüe cuándo cambiar adecuadamente de carril en tiempo real. Para ello, aplicamos nuestro agente propuesto a los experimentos de simulación de movilidad urbana (SUMO). Además, también comprobamos su aplicabilidad al aprendizaje por refuerzo cuyo espacio de acción es discreto (por ejemplo, entornos de juegos de ordenador). En conjunto, concluimos que el marco propuesto supera a los modelos de aprendizaje por refuerzo conocidos hasta ahora en virtud de la doble memoria de repetición de experiencias.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Síntesis de nanopartículas de Ag@Fe3O4 para el tratamiento fototérmico del cáncer de ovario
Artículos:
Sistema de Red de Sensores Múltiples para la Detección de Incendios Forestales Utilizando Procesamiento de Imágenes Infrarrojas
Artículos:
Determinación del módulo elástico de aleaciones de película de Al-Cu preparadas por difusión térmica
Artículos:
Avances recientes en ingeniería de proteínas basada en estructura
Artículos:
Correlación entre los cambios en los niveles séricos de RBP4, hs-CRP e IL-27 y la rosuvastatina en el tratamiento de la cardiopatía coronaria
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.