Estudiamos la viabilidad y capacidad del algoritmo de diferencia temporal del núcleo (KTD)(λ) para la decodificación neuronal. El KTD(λ) es un algoritmo de aprendizaje online basado en el kernel, que ha sido introducido para estimar funciones de valor en el aprendizaje por refuerzo. Este algoritmo combina representaciones basadas en kernels con el enfoque de diferencias temporales para el aprendizaje. Una de nuestras principales observaciones es que al utilizar núcleos estrictamente definidos positivos, se puede garantizar la convergencia del algoritmo para la evaluación de políticas. Las capacidades de aproximación funcional no lineal del algoritmo se muestran tanto en simulaciones de evaluación de políticas como en problemas de decodificación neuronal (mejora de políticas). KTD puede manejar estados neuronales de alta dimensión que contienen información espacio-temporal con una complejidad computacional razonable que permite aplicaciones en tiempo real. Cuando el algoritmo busca un mapeo adecuado entre los estados neuronales de un mono y las posiciones deseadas de un cursor de ordenador o de un brazo robótico, tanto en experimentos de bucle abierto como de bucle cerrado, puede aprender eficazmente el mapeo de estado neuronal a acción. Por último, una visualización del proceso de coadaptación entre el decodificador y el sujeto muestra las capacidades del algoritmo en las interfaces cerebro-máquina de aprendizaje por refuerzo.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Crecimiento de nanorods basados en 2,2-biimidazoles sobre sustrato de mica
Artículos:
Una matriz de SiO2 Sol-Gel sin alcohol funcionalizada con ácido acético como reservorio de fármaco para la liberación controlada de pentoxifilina
Artículos:
Dependencia direccional de la rigidez experimental del tronco: Papel de la variación de la rigidez muscular de origen no neural
Artículos:
Modelo de evaluación de la salud mental de los estudiantes universitarios en el entorno de la iniciativa empresarial independiente mediante la tecnología de redes neuronales
Artículos:
Eliminación de la toxicidad del lixiviado de vertederos en tratamiento combinado con aguas residuales municipales.
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.