Estudiamos la viabilidad y capacidad del algoritmo de diferencia temporal del núcleo (KTD)(λ) para la decodificación neuronal. El KTD(λ) es un algoritmo de aprendizaje online basado en el kernel, que ha sido introducido para estimar funciones de valor en el aprendizaje por refuerzo. Este algoritmo combina representaciones basadas en kernels con el enfoque de diferencias temporales para el aprendizaje. Una de nuestras principales observaciones es que al utilizar núcleos estrictamente definidos positivos, se puede garantizar la convergencia del algoritmo para la evaluación de políticas. Las capacidades de aproximación funcional no lineal del algoritmo se muestran tanto en simulaciones de evaluación de políticas como en problemas de decodificación neuronal (mejora de políticas). KTD puede manejar estados neuronales de alta dimensión que contienen información espacio-temporal con una complejidad computacional razonable que permite aplicaciones en tiempo real. Cuando el algoritmo busca un mapeo adecuado entre los estados neuronales de un mono y las posiciones deseadas de un cursor de ordenador o de un brazo robótico, tanto en experimentos de bucle abierto como de bucle cerrado, puede aprender eficazmente el mapeo de estado neuronal a acción. Por último, una visualización del proceso de coadaptación entre el decodificador y el sujeto muestra las capacidades del algoritmo en las interfaces cerebro-máquina de aprendizaje por refuerzo.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Detección del tallado de la costura de la imagen mediante un nuevo patrón
Artículo:
Propiedades electrónicas, estructurales y ópticas del fósforo azul multicapa: Un estudio de primer principio
Artículo:
Enfoque holístico en el diseño del andamio óseo personalizado: El caso de la reconstrucción de una gran pieza faltante de la mandíbula causada por una anomalía anatómica congénita
Artículo:
Un nuevo enfoque en la estratificación del riesgo mediante angiografía coronaria por TC
Tesis:
Estudio numérico de nanocompositos de matriz metálica usando un enfoque de dislocación discreta