La programación dinámica adaptativa (ADP), que pertenece al campo de la inteligencia computacional, es una herramienta poderosa para abordar problemas de control óptimo. Para superar el cuello de botella de resolver las ecuaciones de Hamilton-Jacobi-Bellman, en este artículo se revisan varios enfoques de vanguardia de ADP. En primer lugar, se presentan dos métodos de ADP iterativos fuera de línea basados en modelos, incluyendo la iteración de políticas (PI) y la iteración de valores (VI), y se discuten en detalle sus respectivas ventajas y desventajas. En segundo lugar, se introduce el método de programación dinámica heurística multietapa (HDP), que evita la necesidad de un control admisible inicial y logra una rápida convergencia. Este método utiliza con éxito las ventajas de PI y VI y supera sus inconvenientes al mismo tiempo. Por último, la estrategia de control óptimo en tiempo discreto se prueba en un sistema de energía.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Avances en redes móviles para el IoT al frente de la 4ª Revolución Industrial
Artículo:
Detección inalámbrica de redes del entorno acuático superficial urbano basada en algoritmos de agrupamiento.
Artículo:
Estudio de simulación sobre la visibilidad del fuego en los planos de piso típicos de edificios de oficinas súper altos modernos en China.
Artículo:
Las estructuras de retícula de operadores de aproximación basados en sistemas de vecindad generalizados L-fuzzy.
Artículo:
Agrupando Clases en Paquetes para la Comprensión de Programas
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo