Biblioteca122.294 documentos en línea

Artículo

Constructing Temporally Extended Actions through Incremental Community DetectionConstrucción de acciones temporalmente extendidas mediante la detección incremental de comunidades

Resumen

El aprendizaje de refuerzo jerárquico trabaja con acciones o habilidades extendidas temporalmente para facilitar el aprendizaje. Cómo formar automáticamente dicha abstracción es un reto, y muchos esfuerzos abordan esta cuestión en el marco de las opciones. Aunque existen varios enfoques para construir opciones desde diferentes perspectivas, pocos de ellos se concentran en la adaptabilidad de las opciones durante el aprendizaje. Este artículo presenta un algoritmo para crear opciones y mejorar su calidad en línea. Ambos aspectos operan sobre comunidades detectadas del gráfico de transición de estados del entorno de aprendizaje. Primero construimos opciones a partir de muestras iniciales como base del aprendizaje en línea. A continuación, se propone un algoritmo de revisión de comunidades basado en reglas para actualizar las particiones del grafo, a partir de las cuales se pueden ajustar continuamente las opciones existentes. Los resultados experimentales en dos problemas indican que las opciones a partir de muestras iniciales pueden funcionar mal en entornos más complejos, y nuestra estrategia presentada puede mejorar eficazmente las opciones y obtener mejores resultados en comparación con el aprendizaje por refuerzo plano.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento