Biblioteca122.739 documentos en línea

Artículos

Nonuniqueness versus Uniqueness of Optimal Policies in Convex Discounted Markov Decision ProcessesNo unicidad versus Unicidad de las Políticas Óptimas en Procesos de Decisión de Markov Convexos con Descuento.

Resumen

Desde el punto de vista clásico, es importante determinar si en un proceso de decisión de Markov (MDP), además de su existencia, se garantiza la unicidad de las políticas óptimas. Es bien sabido que la unicidad no siempre se cumple en problemas de optimización (por ejemplo, en programación lineal). Por otro lado, en tales problemas es posible que una ligera perturbación en el costo funcional restaure la unicidad. En este artículo, se demuestra que las funciones de valor de un MDP y su versión perturbada del costo permanecen cercanas, bajo condiciones adecuadas, lo cual es una prioridad en cierto sentido. Estamos interesados en la estabilidad de los procesos de decisión de Markov con respecto a las perturbaciones de la función de costo conforme avanzamos.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento