Proponemos un algoritmo de asignación dinámica de recursos para la comunicación de dispositivo a dispositivo (D2D) subyacente a una red de Evolución a Largo Plazo Avanzada (LTE-A) con aprendizaje por refuerzo (RL) aplicado para la asignación de canales no licenciados. En un sistema considerado, los recursos en banda y fuera de banda son asignados por el NodoB evolucionado de LTE (eNB) a diferentes pares de dispositivos para maximizar la utilidad de la red sujeta a las restricciones de relación señal a interferencia y ruido (SINR) objetivo. Debido a la ausencia de un enlace de control establecido entre las interfaces de radio no licenciadas y celulares, el eNB no puede adquirir información sobre la calidad y disponibilidad de los canales no licenciados. Como resultado, un problema considerado se convierte en un problema de optimización estocástica que puede ser abordado mediante la implementación de una teoría de aprendizaje (para estimar el entorno de canal no licenciado aleatorio). En consecuencia, formulamos el acceso D2D fuera de banda como un juego dinámico de un solo jugador en el que el jugador (eNB) estima su estrategia posible y utilidad esperada para todas sus acciones basándose únicamente en sus propias observaciones locales utilizando un algoritmo de aprendizaje por refuerzo basado en estimación de utilidad y estrategia conjunta (JUSTE-RL) con arrepentimiento. Un enfoque propuesto para la asignación de recursos demuestra un rendimiento casi óptimo después de un pequeño número de iteraciones de RL y supera a los otros métodos comparables en términos de eficiencia energética y maximización del throughput.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Líneas lineales hápticas mejoradas para una mayor precisión de movimiento en la rehabilitación de miembros superiores.
Artículos:
Algoritmo de Ramificación y Reducción para Problemas de Programación Cuadrática Indefinida
Artículos:
Agresión Independiente de la Escala: Un Análisis Fractal de Cuatro Niveles de Agresión Humana
Artículos:
Algoritmo de colonia de hormigas adaptativo para enrutamiento de vehículos intensivo en red y multiconstraint en el contexto del análisis de redes neuronales.
Artículos:
EAWNet: Un Objetor Atento a los Bordes para Internet Visual en Tiempo Real de las Cosas
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.