Este trabajo presenta un modelo de diseño de rutas de recogida y entrega simultáneas, que considera el uso de taquillas exprés. A diferencia del tradicional problema del viajante de comercio (TSP), este modelo analiza el escenario en el que un mensajero sirve a un barrio con múltiples viajes. Teniendo en cuenta la capacidad de las taquillas y de los vehículos, el coste total se compone de los pedidos pendientes, la pérdida de ventas y el tiempo de viaje. Nuestro objetivo es minimizar el coste total cuando se satisfacen todos los pedidos. Se diseña una red de aprendizaje Q profunda modificada para obtener los resultados óptimos de nuestro modelo, aprovechando la atención multicabezal enmascarada para seleccionar las rutas de mensajería. Nuestro algoritmo supera a otros métodos de optimización estocástica con mejores soluciones óptimas y un tiempo computacional O(n) en los procesos de evaluación. El experimento ha demostrado que el aprendizaje por refuerzo es una mejor opción que los métodos tradicionales de optimización estocástica, ya que consume menos energía y tiempo durante los procesos de evaluación, lo que indica que este enfoque se adapta mejor a los datos a gran escala y a un amplio despliegue.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Biosíntesis de nanopartículas de hierro utilizando extracto de té Tie Guanyin para la degradación del azul de bromotimol
Artículo:
Morfología y Caracterización Electroquímica de Electrodos de Ni-Co Nanocristalinos Electrodepositados para Pilas de Combustible de Metanol
Artículo:
Detección de trazas de tetranitrato de pentaeritritol mediante sensores electroquímicos de gas
Artículo:
Familias de genes vegetales POX y PAL contra el bioterrorismo Modelo de senescencia en ratas
Artículo:
Pirólisis catalítica rápida de Quercus variabilis sobre catalizadores nanoporosos