Este documento trata sobre los procesos de decisión de Markov (MDPs) en espacios euclídeos con un horizonte infinito. Un enfoque para estudiar este tipo de MDPs es utilizando la técnica de programación dinámica (DP). Luego, la función de valor óptimo se caracteriza a través de las funciones de iteración de valor. El documento proporciona condiciones que garantizan la convergencia de los maximizadores de las funciones de iteración de valor hacia la política óptima. Luego, utilizando la ecuación de Euler y una fórmula de sobreenvoltura, se obtiene la solución óptima del problema de control óptimo. Finalmente, esta teoría se aplica a un problema de control lineal-cuadrático para encontrar su política óptima.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Una Introducción a la Red de Petri Firmada
Artículos:
Subespacios discretos de marcos Gabor de múltiples ventanas y sus duales
Artículos:
Una matriz de prueba para un problema de autovalor inverso
Artículos:
Avances recientes en la teoría del operador de homotopía en formas diferenciales.
Artículos:
Simulación de la distribución de tensiones cerca de la línea de soldadura en el proceso de llenado del molde de fundido viscoelástico.
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.