Proponemos un algoritmo de asignación dinámica de recursos para la comunicación de dispositivo a dispositivo (D2D) subyacente a una red de Evolución a Largo Plazo Avanzada (LTE-A) con aprendizaje por refuerzo (RL) aplicado para la asignación de canales no licenciados. En un sistema considerado, los recursos en banda y fuera de banda son asignados por el NodoB evolucionado de LTE (eNB) a diferentes pares de dispositivos para maximizar la utilidad de la red sujeta a las restricciones de relación señal a interferencia y ruido (SINR) objetivo. Debido a la ausencia de un enlace de control establecido entre las interfaces de radio no licenciadas y celulares, el eNB no puede adquirir información sobre la calidad y disponibilidad de los canales no licenciados. Como resultado, un problema considerado se convierte en un problema de optimización estocástica que puede ser abordado mediante la implementación de una teoría de aprendizaje (para estimar el entorno de canal no licenciado aleatorio). En consecuencia, formulamos el acceso D2D fuera de banda como un juego dinámico de un solo jugador en el que el jugador (eNB) estima su estrategia posible y utilidad esperada para todas sus acciones basándose únicamente en sus propias observaciones locales utilizando un algoritmo de aprendizaje por refuerzo basado en estimación de utilidad y estrategia conjunta (JUSTE-RL) con arrepentimiento. Un enfoque propuesto para la asignación de recursos demuestra un rendimiento casi óptimo después de un pequeño número de iteraciones de RL y supera a los otros métodos comparables en términos de eficiencia energética y maximización del throughput.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un Método de Optimización de Gestión de Inventario y Predicción de Demanda basado en Aprendizaje Profundo para la Detección de Anomalías
Artículo:
Un Método para Mejorar la Precisión de los Algoritmos de Predicción de Enlaces
Artículo:
Segmentación automática de historias para video de noticias de televisión utilizando múltiples modalidades.
Artículo:
Algoritmo de detección de límites de cámara de video basado en características SIFT
Artículo:
Actualización del enlace de grupo basado en PMIPv6 para dispositivos IoT
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones