Biblioteca122.294 documentos en línea

Artículo

Online Self-Organizing Network Control with Time Averaged Weighted Throughput ObjectiveControl en línea de redes autoorganizadas con el objetivo de promedio ponderado de rendimiento a través del tiempo.

Resumen

Estudiamos un problema de control de red de colas en línea multi-origen y multi-destino caracterizado por una estructura de red autoorganizadora y enrutamiento de trabajos autoorganizador. Descomponemos el problema de control de red de colas autoorganizadoras en una serie de Procesos de Decisión de Markov interrelacionados y construimos un modelo de decisión de control para ellos basado en la arquitectura de aprendizaje por refuerzo acoplado (RL). Para maximizar el rendimiento promedio ponderado del tiempo de los trabajos a través de la red, proponemos un algoritmo de aprendizaje por refuerzo con recompensa promedio en el tiempo para manejar el modelo de decisión de control y obtener una política de control que integre la estrategia de selección de enrutamiento de trabajos y la estrategia de secuenciación de trabajos. Experimentos computacionales verifican la capacidad de aprendizaje y la efectividad del algoritmo de aprendizaje por refuerzo propuesto aplicado en el problema de control de red autoorganizadora investigado.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento