En este estudio se considera el problema de optimización para el rendimiento del acceso oportunista al espectro. Un usuario, con una capacidad de detección limitada, tiene acceso oportunista a un sistema de comunicación con múltiples canales. El usuario solo puede elegir varios canales para detectar y decide si acceder a estos canales basándose en la información de detección en cada intervalo de tiempo. Mientras tanto, se considera la presencia de errores de detección. Se obtiene una recompensa cuando el usuario accede a un canal. El objetivo es maximizar la recompensa esperada (descontada o promedio) acumulada a lo largo de un horizonte infinito. Este problema puede formularse como un proceso de decisión de Markov parcialmente observable. Este estudio muestra la optimalidad de la política miope simple y robusta que se enfoca en maximizar la recompensa inmediata. Los resultados muestran que la política miope es óptima en el caso de interés práctico.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Condición necesaria y suficiente para que la iteración de Mann converja a un punto fijo de mapeos lipschitzianos.
Artículo:
Perturbación del flujo de Stokes tridimensional de fluidos micropolares por un campo magnético uniforme constante en un cilindro circular
Artículo:
Las soluciones aproximadas de las ecuaciones de difusión tridimensional y de onda dentro del operador derivado local fraccional.
Artículo:
Construcción de la Ondícula de Intervalo Basada en el Principio Variacional Restringido y su Aplicación para Resolver Ecuaciones Diferenciales
Artículo:
Producto cuasi-Hadamard de ciertas funciones -convexas con respecto a puntos simétricos