El aprendizaje profundo por refuerzo es un tipo de algoritmo de aprendizaje automático que utiliza la recompensa acumulativa máxima para aprender la estrategia óptima. La dificultad radica en cómo garantizar la rápida convergencia del modelo y generar una gran cantidad de datos de muestra para promover la optimización del modelo. Utilizando el marco de aprendizaje profundo por refuerzo del algoritmo AlphaZero, el problema de despliegue de nodos inalámbricos en redes inalámbricas ad hoc es equivalente al juego de Go. Se diseña un modelo de despliegue de nodos móviles en redes inalámbricas ad hoc basado en el algoritmo AlphaZero. Debido a que el escenario de aplicación de la red inalámbrica ad hoc no tiene las características de simetría e invariabilidad del tablero de ajedrez, no es posible expandir el conjunto de datos de muestra rotando y cambiando la orientación del tablero de ajedrez. Se utilizan la estrategia de actualización dinámica de la tasa de aprendizaje
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Impacto de los datos de registro en la vitalidad urbana en la península de Macao.
Artículo:
Revisión de la comunicación corporal humana: Modelo de propagación de la señal, rendimiento de la comunicación y cuestiones experimentales
Artículo:
Imagen de Tomografía Computarizada basada en un algoritmo de detección de bordes en el diagnóstico y la enfermería de rehabilitación de pacientes con ictus y disfunción motora.
Artículo:
Diseño óptimo cuadrático del regulador de una válvula de control neumática
Artículo:
Análisis geoespacial de la expansión urbana utilizando métodos y datos de teledetección: Un estudio de caso del Delta del Río Yangtsé, China.
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo