Biblioteca122.739 documentos en línea

Artículo

A Version of the Euler Equation in Discounted Markov Decision ProcessesUna versión de la ecuación de Euler en procesos de decisión de Markov descontados.

Resumen

Este documento trata sobre los procesos de decisión de Markov (MDPs) en espacios euclídeos con un horizonte infinito. Un enfoque para estudiar este tipo de MDPs es utilizando la técnica de programación dinámica (DP). Luego, la función de valor óptimo se caracteriza a través de las funciones de iteración de valor. El documento proporciona condiciones que garantizan la convergencia de los maximizadores de las funciones de iteración de valor hacia la política óptima. Luego, utilizando la ecuación de Euler y una fórmula de sobreenvoltura, se obtiene la solución óptima del problema de control óptimo. Finalmente, esta teoría se aplica a un problema de control lineal-cuadrático para encontrar su política óptima.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento