En el aprendizaje por refuerzo (RL), un agente aprende un entorno a través de ensayo y error. Este comportamiento permite al agente aprender en entornos complejos y difíciles. En RL, el agente normalmente aprende el entorno dado explorando o explotando. La mayoría de los algoritmos sufren de subexploración en la última etapa de los episodios. Recientemente, se propuso un algoritmo fuera de política llamado actor crítico suave (SAC) que supera este problema al maximizar la entropía mientras aprende el entorno. En él, el agente intenta maximizar la entropía junto con las recompensas descontadas esperadas. En SAC, el agente intenta ser lo más aleatorio posible mientras se mueve hacia la recompensa máxima. Esta aleatoriedad permite al agente explorar el entorno y evita que se quede atascado en óptimos locales. Creemos que maximizar la entropía causa la sobreestimación del término de entropía, lo que resulta en un aprendizaje de política lento.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un Marco Eficiente de Detección y Clasificación de Incidentes de Tráfico aprovechando la Eficacia del Apilamiento de Modelos
Artículo:
Un Análisis Comparativo de las Habilidades Predictivas de las Métricas de Complejidad Económica Utilizando la Red de Comercio Internacional
Artículo:
Un nuevo método de identificación de dispositivos basado en mediciones pasivas
Artículo:
Un método inteligente de gestión de la confianza para detectar ataques de encendido y apagado en la Internet de los objetos
Artículo:
Control óptimo aproximado basado en datos del proceso de flotación de azufre
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones