Nonlinear Programming Method for Dynamic Programming
Método de programación no lineal para programación dinámica
La programación dinámica es la herramienta esencial para solucionar problemas de controles dinámicos y estocásticos en análisis económico. La no linealidades de los problemas de este tipo los hacen numéricamente desafiantes. Para evitar esta condición, se han estudiados los enfoques de programación lineal en la literatura. Sin embargo, su valor es limitado para problemas con estados o acciones continuas.
En este documento se introduce una formulación de programación no lineal para resolver problemas de programación dinámica de horizonte infinito. Esto extiende el enfoque lineal a la programación dinámica mediante el uso de ideas de la teoría de aproximación para evitar discretizaciones ineficientes. Los resultados numéricos de este estudio muestran que este método no lineal es eficiente y exacto.
Este artículo fue preparado por Yongyang Cai, Kenneth L. Judd (Hoover Institution, Stanford University, Stanford, CA, Estados Unidos), Thomas S. Lontzek (University of Zurich, Zürich, Suiza), Valentina Michelangeli (Banca dItalia, Roma, Italia) y Che-Lin Su (University of Chicago, Chicago, IL, Estados Unidos). Hace parte de la serie NBER Working Papers (No 19034), producida por el National Bureau of Economic Research NBER (Cambridge, MA, Estados Unidos).
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:374 kb
Symbolic Dynamic Programming for First-order POMDPs
Programación simbólica dinámica para procesos de decisión markovianos parcialmente observables
Los procesos de decisión markovianos parcialmente observables (partially-observable Markov decision processes, POMDP) brindan un poderoso modelo para problemas de toma de decisiones secuenciales con estado parcialmente observable y son conocidos por tener soluciones óptimas de programación dinámica. Gran parte del trabajo en años recientes se ha enfocado en mejorar la eficiencia de estos algoritmos de programación dinámica mediante la explotación de simetrías y relaciones relacionales o tenidas en cuenta.
En este documento se muestra que también es posible aprovechar el poder expresivo total de la cuantificación de primer orden para lograr abstracción de estado, acción y observación en una solución de programación dinámica para POMDP especificados relacionalmente.
Esta ponencia fue preparada por Scott Sanner (NICTA, Canberra, Australia) y Kristian Kersting (Fraunhofer IAIS, Sankt Augustin, Alemania) para la "Twenty-Fourth AAAI Conference on Artificial Intelligence" (AAAI 2010) (Atlanta, GA, Estados Unidos, 11-15 de julio de 2010), evento organizado por la Association for the Advancement of Artificial Intelligence AAAI (Palo Alto, CA, Estados Unidos). Se encuentra incluida en sus Proceedings (Palo Alto, CA: AAAI Press, 2010, pp. 1140-1146) y alojada en la sección Presentations and Authors.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:292 kb