Proponemos un algoritmo de aprendizaje Q cooperativo multiagente llamado explorando acciones según las proporciones de los valores Q (EAQR). Nuestro objetivo es diseñar un algoritmo de aprendizaje por refuerzo multiagente para tareas cooperativas donde múltiples agentes necesitan coordinar su comportamiento para lograr el mejor rendimiento del sistema. En EAQR, el valor Q representa la probabilidad de obtener la recompensa máxima, mientras que cada acción se selecciona según la proporción de su valor Q respecto a la suma de todos los valores Q de las acciones y la tasa de exploración. Se utilizan siete juegos cooperativos repetidos como casos de estudio para analizar la dinámica de EAQR. Los análisis teóricos muestran que en algunos casos las estrategias conjuntas óptimas corresponden a los puntos críticos estables de EAQR. Además, se realizan experimentos de comparación en juegos estocásticos con pasos finitos. Uno es el empuje de cajas, y el otro es el problema de la red de sensores distribuidos. Los resultados experimentales
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Simulación y modelización en la mecanización agrícola
Artículo:
Algoritmo de posicionamiento de personal subterráneo basado en Monte Carlo mejorado
Artículo:
Una estrategia de toma de decisiones inspirada en Physarum para la búsqueda de tareas de múltiples fuentes de robots móviles.
Artículo:
Selección adaptativa del conjunto de imágenes de referencia en la inspección automatizada por rayos X
Artículo:
Predicción para series temporales caóticas basadas en AE-CNN y aprendizaje por transferencia
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo