Biblioteca122.294 documentos en línea

Artículo

Kernel Recursive Least-Squares Temporal Difference Algorithms with Sparsification and RegularizationAlgoritmos de diferencia temporal por mínimos cuadrados recursivos con sparsificación y regularización

Resumen

Al combinarse con métodos de kernel disperso, los algoritmos de diferencia temporal por mínimos cuadrados (LSTD) pueden construir el diccionario de características automáticamente y obtener una mejor capacidad de generalización. Sin embargo, los algoritmos LSTD anteriores basados en kernel no consideran la regularización y sus procesos de sparsificación son por lotes o fuera de línea, lo que dificulta su aplicación generalizada en problemas de aprendizaje en línea. En este trabajo, combinamos las siguientes cinco técnicas y proponemos dos nuevos algoritmos LSTD recursivos de kernel: (i) la sparsificación online, que puede hacer frente a regiones de estado desconocidas y utilizarse para el aprendizaje online, (ii) la regularización L2 y L1, que puede evitar el sobreajuste y eliminar la influencia del ruido, (iii) los mínimos cuadrados recursivos, que pueden eliminar las operaciones de inversión matricial y reducir la complejidad computacional, (iv) un enfoque de ventana deslizante, que puede evitar el almacenamiento en caché de todas las muestras de la historia y reducir el coste computacional, y (v) la subiteración de punto fijo y la poda online, que pueden hacer que la regularización L1 sea fácil de implementar. Por último, los resultados de la simulación de dos problemas de cadena de 50 estados demuestran la eficacia de nuestros algoritmos.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento