Este trabajo propone un diseño de control adaptativo tridimensional (3D) de seguimiento de trayectoria para una aeronave robótica basado en el aprendizaje por refuerzo. El control de seguimiento de la trayectoria en 3D de la aeronave se descompone en el control de altitud y el control de seguimiento de la trayectoria plana, y se establecen los modelos del proceso de decisión de Markov (MDP) de los problemas de control, en los que la escala del espacio de estado se reduce mediante la simplificación de los parámetros y la transformación de las coordenadas. Para garantizar la adaptabilidad del control sin depender de un modelo dinámico preciso de la aeronave, se adopta directamente un algoritmo Q-Learning para el aprendizaje de la política de acción de los comandos de los actuadores, y el controlador se entrena en línea basándose en el movimiento real. Para acelerar el proceso de entrenamiento se emplea una red neuronal de controlador de articulación de modelo cerebeloso (CMAC) para la generalización de la experiencia. Los resultados de la simulación demuestran que los controladores propuestos pueden alcanzar un rendimiento comparable al de los controladores diferenciales integrales de proporción (PID) bien ajustados y tienen una capacidad de decisión más inteligente.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Investigación experimental sobre la viabilidad del uso de un pasador Pogo cargado con un muelle como mecanismo de sujeción y liberación para los paneles solares desplegables del CubeSat
Artículos:
Respuesta transitoria de un motor aeronáutico simulado con una estructura de fusión durante un evento de salida del álabe del ventilador
Artículos:
Encuentro óptimo no cooperativo desencadenado por el umbral de tiempo y covarianza utilizando la navegación sólo por ángulos
Artículos:
Análisis numérico de las influencias de la desviación geométrica en la delaminación en laminados compuestos alrededor del agujero avellanado
Artículos:
Estudio experimental basado en el brazo giratorio sobre el comportamiento de las gotas en la región del hombro de una superficie aerodinámica de un avión
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.