Biblioteca122.294 documentos en línea

Artículo

EAQR: A Multiagent Q-Learning Algorithm for Coordination of Multiple AgentsEAQR: Un algoritmo de aprendizaje Q multiagente para la coordinación de múltiples agentes

Resumen

Proponemos un algoritmo de aprendizaje Q cooperativo multiagente llamado explorando acciones según las proporciones de los valores Q (EAQR). Nuestro objetivo es diseñar un algoritmo de aprendizaje por refuerzo multiagente para tareas cooperativas donde múltiples agentes necesitan coordinar su comportamiento para lograr el mejor rendimiento del sistema. En EAQR, el valor Q representa la probabilidad de obtener la recompensa máxima, mientras que cada acción se selecciona según la proporción de su valor Q respecto a la suma de todos los valores Q de las acciones y la tasa de exploración. Se utilizan siete juegos cooperativos repetidos como casos de estudio para analizar la dinámica de EAQR. Los análisis teóricos muestran que en algunos casos las estrategias conjuntas óptimas corresponden a los puntos críticos estables de EAQR. Además, se realizan experimentos de comparación en juegos estocásticos con pasos finitos. Uno es el empuje de cajas, y el otro es el problema de la red de sensores distribuidos. Los resultados experimentales

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento