Los satélites de realidad virtual brindan a las personas una experiencia inmersiva de explorar el espacio. El método inteligente de control de actitud que utiliza el aprendizaje por refuerzo para lograr un control síncrono multieje es una de las tareas importantes de los satélites de realidad virtual. En sistemas del mundo real, los métodos basados en el aprendizaje por refuerzo enfrentan problemas de seguridad durante la exploración, retardos desconocidos en los actuadores y ruido en los datos crudos de los sensores. Para mejorar la eficiencia de la muestra y evitar problemas de seguridad durante la exploración, este artículo propone un nuevo método de aprendizaje por refuerzo fuera de línea para aprovechar al máximo las muestras. Este método aprende un conjunto de políticas con aprendizaje por imitación y un selector de políticas utilizando una red generativa adversarial (GAN). El rendimiento del método propuesto se verificó en un sistema del mundo real (péndulo invertido basado en ruedas de reacción). Los resultados mostraron que el agente entrenado con nuestro método alcanzó y mantuvo
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Programación de tareas asociadas a múltiples trabajos para la computación en la nube basada en la duplicación e inserción de tareas.
Artículos:
Optimizando la reanudación de punto de control con deduplicación de datos.
Artículos:
Algoritmo de optimización de decisiones colectivas multiobjetivo para el problema de despacho económico de emisiones.
Artículos:
Localización y seguimiento submarinos de sistemas físicos
Artículos:
Aprendiendo la Estructura de Redes Bayesianas: Una Evaluación Cuantitativa del Efecto de Diferentes Esquemas Algorítmicos
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.