Biblioteca122.739 documentos en línea

Artículo

Three-Dimensional Path-Following Control of a Robotic Airship with Reinforcement LearningControl tridimensional de la trayectoria de una aeronave robótica con aprendizaje por refuerzo

Resumen

Este trabajo propone un diseño de control adaptativo tridimensional (3D) de seguimiento de trayectoria para una aeronave robótica basado en el aprendizaje por refuerzo. El control de seguimiento de la trayectoria en 3D de la aeronave se descompone en el control de altitud y el control de seguimiento de la trayectoria plana, y se establecen los modelos del proceso de decisión de Markov (MDP) de los problemas de control, en los que la escala del espacio de estado se reduce mediante la simplificación de los parámetros y la transformación de las coordenadas. Para garantizar la adaptabilidad del control sin depender de un modelo dinámico preciso de la aeronave, se adopta directamente un algoritmo Q-Learning para el aprendizaje de la política de acción de los comandos de los actuadores, y el controlador se entrena en línea basándose en el movimiento real. Para acelerar el proceso de entrenamiento se emplea una red neuronal de controlador de articulación de modelo cerebeloso (CMAC) para la generalización de la experiencia. Los resultados de la simulación demuestran que los controladores propuestos pueden alcanzar un rendimiento comparable al de los controladores diferenciales integrales de proporción (PID) bien ajustados y tienen una capacidad de decisión más inteligente.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento