La gestión de inventario es un problema de decisión secuencial que puede resolverse con aprendizaje por refuerzo (RL). Aunque RL en su forma convencional no requiere conocimiento del dominio, aprovechar dicho conocimiento de la estructura del problema, generalmente disponible en la gestión de inventario, puede ser beneficioso para mejorar la calidad de aprendizaje y la velocidad de RL. El aprendizaje por refuerzo rumiativo (RRL) se ha introducido recientemente basado en este enfoque. RRL está motivado por cómo los humanos contemplan las consecuencias de sus acciones al intentar aprender a tomar una mejor decisión. Este estudio investiga más a fondo los problemas de RRL y propone nuevos métodos de RRL aplicados a la gestión de inventario. Nuestra investigación proporciona información sobre las diferentes características de RRL, y nuestros resultados experimentales muestran la viabilidad de los nuevos métodos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un enfoque de evaluación dinámica multiagente de la calidad del agua basado en un algoritmo de aprendizaje Q mejorado
Artículo:
Modelando la Dependencia de Pérdidas de una Cartera Financiera Utilizando Cópulas Arquimedianas Anidadas
Artículo:
Modelando el efecto de computadoras externas y dispositivos extraíbles en una red informática con inmunidad heterogénea
Artículo:
Filtrado de imagen para la reducción de ruido basado en el operador fraccional adaptativo con derivadas de Atangana-Baleanu.
Artículo:
Nota sobre las soluciones de las ecuaciones de Van der Pol y Duffing mediante un método de linealización