Non-deterministic policies in markovian decision processes
Políticas no deterministas en procesos de decisión markovianos
En este documento se introduce el concepto novedoso de polìticas no deterministas para permitir mayor flexibilidad en el proceso de toma de decisiones del usuario mientras las decisiones de restricciòn se ubican cerca a las soluciones óptimas. Se brindan dos algoritmos para computar las polìticas no deterministas en dominios discretos. Se estudia el resultado y el tiempo de funcionamiento de este método en un conjunto de problemas sintéticos y de la vida real. En un experimento con sujetos humanos se muestra que estos, asistidos por indicios con base en políticas no deterministas, superaron a los agentes computacionales y humanos en una tarea de navegación en la red.
Este artículo fue escrito por Mahdi Milani Fard y Joelle Pineau (Reasoning and Learning Laboratory, School of Computer Science, McGill University, Montreal, QC, Canadá) para el Journal of Artificial Intelligence Research (Vol. 40, 2011, 1-24), publicación de AAAI Press (Palo Alto, CA, Estados Unidos) que cubre todas las áreas de la inteligencia artificial.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:363 kb
Approximations for markov chains with upper hessenberg transition matrices
Aproximaciones para cadenas de Markov con matrices superiores de transición de Hessenberg
Aquí se presenta una aproximación para la distribución estacionaria π de una cadena de Markov de estado infinito con matriz de probabilidad de transición P = (pij) de la forma Hessenberg superior. Tal aproximación hace uso de una matriz superior de Hessenberg asociada, la cual es espacialmente homogénea un P(N), excepto para un número finito de filas obtenidas dejando pij = pj-i+1, i ≥ N + 1 para alguna distribución p = {pj} con media ρ < 1, donde p-j = 0 para j ≥ 1.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:210 kb