Biblioteca122.294 documentos en línea

Artículo

Learning from Demonstrations and Human Evaluative Feedbacks: Handling Sparsity and Imperfection Using Inverse Reinforcement Learning ApproachAprendizaje a partir de demostraciones y retroalimentación evaluativa humana: Manejo de la escasez y la imperfección mediante un enfoque de aprendizaje por refuerzo inverso

Resumen

La programación por demostraciones es uno de los métodos más eficientes para la transferencia de conocimientos en el desarrollo de sistemas de aprendizaje avanzado, siempre y cuando los profesores proporcionen demostraciones abundantes y correctas, y los alumnos las perciban correctamente. Sin embargo, las demostraciones son insuficientes e incompletas en casi todos los problemas del mundo real. Se necesita información complementaria para compensar estas deficiencias de las demostraciones. En este artículo, nos enfocamos en la programación a través de una combinación de demostraciones y retroalimentaciones evaluativas binarias limitadas, donde el alumno utiliza sus propias experiencias evaluadas como nuevas demostraciones en un método extendido de aprendizaje inverso por refuerzo. Esto proporciona al alumno una generalización más amplia y menos arrepentimiento, así como robustez frente a la escasez y la no optimalidad en las demostraciones y retroalimentaciones. Nuestro método alivia la carga irrealista sobre los profesores de proporcionar demostraciones óptimas y abundantes. El uso de una retroalimentación evaluativa, que es fácil

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento