El aprendizaje y la inteligencia humanos funcionan de forma diferente al enfoque de reconocimiento de patrones supervisado adoptado en la mayoría de las arquitecturas de aprendizaje profundo. Los humanos parecen aprender representaciones ricas mediante la exploración y la imitación, construyen modelos causales del mundo y utilizan ambos para resolver de forma flexible nuevas tareas. Proponemos un modelo simple pero eficaz sin supervisión que desarrolla estas características. El agente aprende a representar las propiedades físicas dinámicas de su entorno mediante la exploración intrínsecamente motivada y realiza inferencia sobre esta representación para alcanzar objetivos. Para ello, se combina un conjunto de mapas autoorganizativos que representan pares estado-acción con un modelo causal para la predicción de secuencias. El sistema propuesto se evalúa en el entorno de Cartpole. Tras una fase inicial de exploración lúdica, el agente puede ejecutar simulaciones cinemáticas del futuro del entorno y utilizarlas para la planificación de acciones. Demostramos su rendimiento en un conjunto de varias tareas de imitación relacionadas, pero diferentes, que el agente resuelve con flexibilidad en un estilo de inferencia activa.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estudio FMR de los vidrios porosos de silicato con rellenos de nanopartículas magnéticas Fe3O4
Artículo:
Detección de miel adulterada mediante matrices de excitación-emisión de fluorescencia
Artículo:
Cambios en la microestructura de películas de Ti-Al-C depositadas por arco catódico filtrado en vacío
Artículo:
Enfoque de aprendizaje automático para optimizar la relación SMOTE en el conjunto de datos de desequilibrio de clases para la detección de intrusiones
Artículo:
Osteoinductividad intrínseca del andamio de titanio poroso para la ingeniería de tejidos óseos