Biblioteca122.294 documentos en línea

Ficha técnica

9 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish SpacesIteración de políticas para procesos de decisión de Markov con recompensa promedio en tiempo continuo en espacios polacos.

Resumen

Estudiamos el (PIA) para procesos de decisión de Markov de salto en tiempo continuo en espacios de estado y acción generales. Se permite que las tasas de transición correspondientes sean , y las tasas de recompensa pueden tener . El criterio con el que nos preocupamos es . Proponemos un conjunto de condiciones bajo las cuales primero establecemos la ecuación de optimalidad de recompensa promedio y presentamos el PIA. Luego, bajo dos diferentes conjuntos de condiciones, demostramos que el PIA produce la recompensa óptima (máxima), una política estacionaria óptima promedio, y una solución a la ecuación de optimalidad de recompensa promedio.

Materias:Ecuaciones diferenciales Ecuaciones hiperbÃ³licas Vector de control
Subjects:Differential equations Hyperbolic equations Control vector
Palabras claves:Tiempo continuo; Salto; Procesos de decisión de Markov; Recompensa promedio; Ecuación de optimalidad; PIA
Keywords:Continuous-time; Jump; Markov decision processes; Average reward; Optimality equation; PIA

Autor:Zhu, Quanxin; Yang, Xinsong; Huang, Chuangxia.
Categoría:Ciencias naturales y subdisciplinas
Subcategoría:Matemáticas
Año de publicación:2009.
Editor:Hindawi Publishing Corporation

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces

DC.Title.eng

Iteración de políticas para procesos de decisión de Markov con recompensa promedio en tiempo continuo en espacios polacos.

DC.Creator

Zhu, Quanxin; Yang, Xinsong; Huang, Chuangxia

DC.Subject.snpi.spa

Ecuaciones diferenciales Ecuaciones hiperbÃ³licas Vector de control

DC.Subject.snpi.eng

Differential equations Hyperbolic equations Control vector

DC.Subject.spa

Tiempo continuo; Salto; Procesos de decisión de Markov; Recompensa promedio; Ecuación de optimalidad; PIA

DC.Subject.eng

Continuous-time; Jump; Markov decision processes; Average reward; Optimality equation; PIA

DC.Description.spa

DC.Source

https://www.hindawi.com/journals/aaa/2009/103723

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/optimizacion-de-politicas-en-procesos-de-decision-de-markov-105202

DC.Identifier.issn-isbn

ISSN:1085-3375

DC.Identifier.citacion

Revista Virtual Pro, ,

DC.Language

Inglés

DC.Relation

DC.Publisher

Hindawi Publishing Corporation

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2009

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

https://downloads.hindawi.com/journals/aaa/2009/103723.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces
Autor:Zhu, Quanxin; Yang, Xinsong; Huang, Chuangxia
Tipo:Artículo
Año:2009
Idioma:Inglés
Editor:Hindawi Publishing Corporation
Materias:Ecuaciones diferenciales Ecuaciones hiperbÃ³licas Vector de control
Descarga:0

Biblioteca122.294 documentos en línea

Ficha técnica

Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish SpacesIteración de políticas para procesos de decisión de Markov con recompensa promedio en tiempo continuo en espacios polacos.

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Principios de Onda en una cuerda

Introducción a Polaridad de la molécula

Cadena de producción de la carne

Ósmosis inversa

Principios de Adición de Vectores

Matriz de alternativas ambientales

Generalidades de Masas y Resortes

Videos

Webinar: Calculando la frecuencia óptima de mantenimiento o reemplazo preventivo

Envasado de aceite

Gas de esquistos en los Estados Unidos

Lo que los planeadores de desarrollo económico deberían saber acerca del desarrollo ecoindustrial

Mejores práctica de gestión global, por Welingkar DLP

Agricultural biotechnology. Parte 3

Extrusión de materiales poliméricos

Documentos más descargados

2024-03-06
Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca122.294 documentos en línea

Ficha técnica

Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish SpacesIteración de políticas para procesos de decisión de Markov con recompensa promedio en tiempo continuo en espacios polacos.

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Principios de Onda en una cuerda

Introducción a Polaridad de la molécula

Cadena de producción de la carne

Ósmosis inversa

Principios de Adición de Vectores

Matriz de alternativas ambientales

Generalidades de Masas y Resortes

Videos

Webinar: Calculando la frecuencia óptima de mantenimiento o reemplazo preventivo

Envasado de aceite

Gas de esquistos en los Estados Unidos

Lo que los planeadores de desarrollo económico deberían saber acerca del desarrollo ecoindustrial

Mejores práctica de gestión global, por Welingkar DLP

Agricultural biotechnology. Parte 3

Extrusión de materiales poliméricos

Documentos más descargados

2024-03-06Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2024-03-06
Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial