Biblioteca122.294 documentos en línea

Artículo

A Decentralized Partially Observable Markov Decision Model with Action Duration for Goal Recognition in Real Time Strategy GamesUn Modelo de Decisión de Markov Parcialmente Observable y Descentralizado con Duración de Acción para el Reconocimiento de Objetivos en Juegos de Estrategia en Tiempo Real

Resumen

El reconocimiento de metas multiagente es un problema difícil pero importante en muchos juegos de estrategia en tiempo real o sistemas de simulación. Los métodos de modelado tradicionales suelen requerir un amplio conocimiento detallado del dominio de los agentes y un conjunto de datos de entrenamiento para la estimación de políticas, o carecen de una definición clara de la duración de las acciones. Para resolver los problemas mencionados, proponemos un modelo novedoso llamado Dec-POMDM-T, que combina el clásico Dec-POMDP, un modelo de observación para el reconocedor, la meta conjunta con su indicador de terminación, y variables de duración temporal para las acciones con variables de terminación de acciones. En este documento, se utiliza un algoritmo sin modelo llamado coaprendizaje cooperativo basado en Sarsa. Dado que Dec-POMDM-T suele enfrentar problemas de reconocimiento de metas multiagente con diferentes tipos de ruidos, datos parcialmente faltantes y duraciones de acciones desconocidas, el documento explora el SIS PF con remuestreo para la infer

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento