Observar el universo con un satélite de realidad virtual es una experiencia increíble. Un método inteligente de control de actitud es el objeto central de investigación para lograr este objetivo. El control de actitud es esencialmente una de las tareas de alcanzar un estado objetivo bajo restricciones. El uso de métodos de aprendizaje por refuerzo en sistemas del mundo real enfrenta muchos desafíos, como muestras insuficientes, problemas de seguridad en la exploración, retrasos desconocidos en los actuadores y ruido en los datos crudos de los sensores. En este trabajo, se propuso un modelo mixto con diferentes tamaños de entrada para representar el modelo de dinámica ambiental. La precisión de predicción del modelo de dinámica ambiental y el rendimiento de la política entrenada en este documento mejoraron gradualmente. Nuestro método reduce el impacto de los datos ruidosos en la precisión de los modelos y mejora la eficiencia de muestreo. Los experimentos mostraron que el agente entrenado con nuestro método completó una tarea de alcanzar un estado objetivo en un sistema del mundo
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Detección de un canal encubierto inalámbrico modulado por constelación basado en un modelo CNN ajustado
Artículo:
Diseño de una aplicación de plan de muestreo de estado múltiple dependiente para datos de COVID-19 utilizando la distribución Weibull exponenciada.
Artículo:
Plataforma para el acceso a servicios desde dispositivos móviles utilizando parámetros de autenticación basados en SIM Card
Artículo:
Desarrollo de un modelo de supervivencia profunda para la estimación de la vida útil restante basado en redes neuronales convolucionales y de memoria a largo plazo y corto plazo.
Artículo:
VoNR-IPD: una novedosa esteganografía de red basada en la temporización para Internet industrial