El aprendizaje y la inteligencia humanos funcionan de forma diferente al enfoque de reconocimiento de patrones supervisado adoptado en la mayoría de las arquitecturas de aprendizaje profundo. Los humanos parecen aprender representaciones ricas mediante la exploración y la imitación, construyen modelos causales del mundo y utilizan ambos para resolver de forma flexible nuevas tareas. Proponemos un modelo simple pero eficaz sin supervisión que desarrolla estas características. El agente aprende a representar las propiedades físicas dinámicas de su entorno mediante la exploración intrínsecamente motivada y realiza inferencia sobre esta representación para alcanzar objetivos. Para ello, se combina un conjunto de mapas autoorganizativos que representan pares estado-acción con un modelo causal para la predicción de secuencias. El sistema propuesto se evalúa en el entorno de Cartpole. Tras una fase inicial de exploración lúdica, el agente puede ejecutar simulaciones cinemáticas del futuro del entorno y utilizarlas para la planificación de acciones. Demostramos su rendimiento en un conjunto de varias tareas de imitación relacionadas, pero diferentes, que el agente resuelve con flexibilidad en un estilo de inferencia activa.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Evaluación del Potencial Actual y Futuro de la Energía Eólica Marina: Un Estudio de Caso en un Territorio Objetivo del Mar Báltico Cerca de la Costa de Letonia
Artículos:
Reducción de energía en el control de helicópteros utilizando una cola horizontal móvil.
Artículos:
Revisión exhaustiva de la aplicación del concepto de biorrefinería en las plantas de producción de biodiésel
Artículos:
Dependencia del tamaño de la plasticidad mediada por dislocaciones en monocristales de Ni: Simulaciones de dinámica molecular
Artículos:
Síntesis y caracterización en un solo paso de esferas nanométricas/submicrométricas de sílice mediante pirólisis asistida por catalizador de un polímero precerámico
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.