Biblioteca122.739 documentos en línea

Artículo

Online Optimal Control of Robotic Systems with Single Critic NN-Based Reinforcement LearningControl en línea óptimo de sistemas robóticos con aprendizaje por refuerzo basado en redes neuronales de un solo crítico

Resumen

Este documento sugiere una solución en línea para el control óptimo de seguimiento de sistemas robóticos basada en un método de aprendizaje por refuerzo (RL) basado en una red neuronal (NN) de crítico único. Con este fin, reescribimos el modelo del sistema robótico en forma de espacio de estados, lo que facilitará la realización de la síntesis de control de seguimiento óptimo. Para mantener la respuesta de seguimiento, se diseña un control en estado estable, y luego se utiliza un control de seguimiento óptimo adaptativo para garantizar que el error de seguimiento pueda lograr convergencia de manera óptima. Para resolver el control óptimo obtenido a través del marco de programación dinámica adaptativa (ADP), se formulan la trayectoria de comando a seguir y el Hamiltoniano-Jacobi-Bellman (HJB) de seguimiento modificado. Se desarrolla un algoritmo de RL en línea para abordar la ecuación HJB utilizando una red neuronal de crítico con algoritmo de aprendizaje en línea. Se proporcionan resultados de simulación para verificar

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento