Estudiamos un problema conjunto de fijación de precios y control de inventario para productos perecederos con tiempo de espera positivo en un sistema de revisión periódica de horizonte finito. A diferencia de la mayoría de los estudios que consideran una función de densidad continua de la demanda, en nuestro artículo la demanda del cliente depende del precio del período actual y llega de acuerdo con un proceso de Poisson homogéneo. Consideramos casos de acumulación y pérdida de ventas, y nuestro objetivo es encontrar una política de ordenación y fijación de precios simultáneas para maximizar el beneficio esperado descontado durante el horizonte de planificación. Cuando no hay costos de orden fijos involucrados, diseñamos un algoritmo de aprendizaje profundo por refuerzo para obtener una política de ordenación casi óptima y demostramos que existen algunas propiedades de monotonía en la política aprendida. También mostramos que nuestro algoritmo de aprendizaje profundo por refuerzo logra un mejor rendimiento que los algoritmos de Q-learning basados en tablas. Cuando hay un
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Desarrollo del inglés oral de estudiantes de inglés como lengua extranjera desde la perspectiva de la Teoría Dinámica de la Complejidad.
Artículo:
Sistema de alerta inteligente basado en IoT para la detección de conductores somnolientos.
Artículo:
Recomendación de Servicio con Alta Precisión y Diversidad
Artículo:
Predicción temprana de fallas orgánicas en pacientes con pancreatitis aguda utilizando minería de texto.
Artículo:
Un protocolo de autenticación de seguridad novedoso basado en una función física única para sistemas de salud RFID.