Proponemos un algoritmo de aprendizaje Q cooperativo multiagente llamado explorando acciones según las proporciones de los valores Q (EAQR). Nuestro objetivo es diseñar un algoritmo de aprendizaje por refuerzo multiagente para tareas cooperativas donde múltiples agentes necesitan coordinar su comportamiento para lograr el mejor rendimiento del sistema. En EAQR, el valor Q representa la probabilidad de obtener la recompensa máxima, mientras que cada acción se selecciona según la proporción de su valor Q respecto a la suma de todos los valores Q de las acciones y la tasa de exploración. Se utilizan siete juegos cooperativos repetidos como casos de estudio para analizar la dinámica de EAQR. Los análisis teóricos muestran que en algunos casos las estrategias conjuntas óptimas corresponden a los puntos críticos estables de EAQR. Además, se realizan experimentos de comparación en juegos estocásticos con pasos finitos. Uno es el empuje de cajas, y el otro es el problema de la red de sensores distribuidos. Los resultados experimentales
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Descubrir ciberdelitos en las redes sociales mediante el procesamiento del lenguaje natural
Artículos:
Investigación sobre el Modelo de Evaluación de la Demanda de Información Rural Basado en Big Data
Artículos:
Programación de tareas asociadas a múltiples trabajos para la computación en la nube basada en la duplicación e inserción de tareas.
Artículos:
Fusión de datos para la detección de intrusiones en la red: Una revisión
Artículos:
Aplicación del algoritmo de optimización de simulación por computadora en el tratamiento de residuos de ingeniería de perforación.
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.