El reconocimiento de metas multiagente es un problema difícil pero importante en muchos juegos de estrategia en tiempo real o sistemas de simulación. Los métodos de modelado tradicionales suelen requerir un amplio conocimiento detallado del dominio de los agentes y un conjunto de datos de entrenamiento para la estimación de políticas, o carecen de una definición clara de la duración de las acciones. Para resolver los problemas mencionados, proponemos un modelo novedoso llamado Dec-POMDM-T, que combina el clásico Dec-POMDP, un modelo de observación para el reconocedor, la meta conjunta con su indicador de terminación, y variables de duración temporal para las acciones con variables de terminación de acciones. En este documento, se utiliza un algoritmo sin modelo llamado coaprendizaje cooperativo basado en Sarsa. Dado que Dec-POMDM-T suele enfrentar problemas de reconocimiento de metas multiagente con diferentes tipos de ruidos, datos parcialmente faltantes y duraciones de acciones desconocidas, el documento explora el SIS PF con remuestreo para la infer
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Algoritmo evolutivo multiagente para el problema de selección y programación de carteras de proyectos con recursos limitados
Artículo:
Un Nuevo Resultado de Mejor Aproximación en Espacios Métricos Convexos
Artículo:
Un enfoque para generar pesos utilizando la matriz de comparación par a par.
Artículo:
Parámetros de dirección para la inyección de lechada de roca.
Artículo:
Soluciones positivas para un sistema diferencial fraccional singular -Laplaciano con condiciones de frontera integrales.