Biblioteca122.739 documentos en línea

Artículo

Research on the Difficulty of Mobile Node Deployment’s Self-Play in Wireless Ad Hoc Networks Based on Deep Reinforcement LearningInvestigación sobre la dificultad del despliegue de nodos móviles en redes ad hoc inalámbricas basada en el aprendizaje profundo por refuerzo.

Resumen

El aprendizaje profundo por refuerzo es un tipo de algoritmo de aprendizaje automático que utiliza la recompensa acumulativa máxima para aprender la estrategia óptima. La dificultad radica en cómo garantizar la rápida convergencia del modelo y generar una gran cantidad de datos de muestra para promover la optimización del modelo. Utilizando el marco de aprendizaje profundo por refuerzo del algoritmo AlphaZero, el problema de despliegue de nodos inalámbricos en redes inalámbricas ad hoc es equivalente al juego de Go. Se diseña un modelo de despliegue de nodos móviles en redes inalámbricas ad hoc basado en el algoritmo AlphaZero. Debido a que el escenario de aplicación de la red inalámbrica ad hoc no tiene las características de simetría e invariabilidad del tablero de ajedrez, no es posible expandir el conjunto de datos de muestra rotando y cambiando la orientación del tablero de ajedrez. Se utilizan la estrategia de actualización dinámica de la tasa de aprendizaje

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento