Biblioteca122.294 documentos en línea

Artículo

Solving a Joint Pricing and Inventory Control Problem for Perishables via Deep Reinforcement LearningResolviendo un problema conjunto de fijación de precios y control de inventario para productos perecederos a través del aprendizaje profundo por refuerzo.

Resumen

Estudiamos un problema conjunto de fijación de precios y control de inventario para productos perecederos con tiempo de espera positivo en un sistema de revisión periódica de horizonte finito. A diferencia de la mayoría de los estudios que consideran una función de densidad continua de la demanda, en nuestro artículo la demanda del cliente depende del precio del período actual y llega de acuerdo con un proceso de Poisson homogéneo. Consideramos casos de acumulación y pérdida de ventas, y nuestro objetivo es encontrar una política de ordenación y fijación de precios simultáneas para maximizar el beneficio esperado descontado durante el horizonte de planificación. Cuando no hay costos de orden fijos involucrados, diseñamos un algoritmo de aprendizaje profundo por refuerzo para obtener una política de ordenación casi óptima y demostramos que existen algunas propiedades de monotonía en la política aprendida. También mostramos que nuestro algoritmo de aprendizaje profundo por refuerzo logra un mejor rendimiento que los algoritmos de Q-learning basados en tablas. Cuando hay un

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento