Se ha presentado una nueva teoría de control de seguimiento óptimo robusto de aprendizaje por refuerzo descentralizado para robots modulares reconfigurables con restricciones temporales basadas en el identificador crítico de acciones (ACI) y la función de valor estado-acción (función Q) para resolver el problema de la política de control óptimo no lineal en tiempo continuo para sistemas robóticos de incertidumbre fuertemente acoplados. La dinámica del robot modular reconfigurable con restricciones temporales se describe como una síntesis de subsistemas interconectados, y en este trabajo se han diseñado la ecuación de estado en tiempo continuo y la función Q. Combinando ACI y la red RBF, se ha estimado la incertidumbre global del subsistema y la ecuación HJB (Hamilton-Jacobi-Bellman), donde se utilizan Critic-NN y Action-NN para aproximar la función Q óptima y la política de control óptima, y se adopta el identificador para identificar la incertidumbre global así como RBF-NN que se utiliza para actualizar los pesos de ACI-NN. Sobre esta base, se propone un nuevo controlador de seguimiento óptimo robusto descentralizado del subsistema, de modo que el subsistema puede seguir la trayectoria deseada y el error de seguimiento puede converger a cero en un tiempo finito. La teoría de Lyapunov confirma la estabilidad del ACI y del controlador de seguimiento óptimo robusto. Por último, se presentan ejemplos de simulación comparativa para ilustrar la eficacia del ACI propuesto y la teoría de control descentralizado.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Modelo constitutivo de fluencia dependiente del tiempo de rocas profundas circundantes bajo acoplamiento de temperatura y tensión
Artículos:
Un nuevo método de fusión de imágenes basado en FRFT-NSCT
Artículos:
Estimación simultánea de fallos en actuadores y sensores basada en observadores de modo deslizante para sistemas lineales con parámetros variables
Artículos:
Solución numérica de la ecuación de advección-difusión mediante un método compacto de diferencias finitas de sexto orden
Artículos:
Rechazo activo de perturbaciones con control de modo deslizante basado en el seguimiento del rumbo y la trayectoria para buques subactuados
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.