En este trabajo se propone un método cognitivo de toma de decisiones sobre interferencias electrónicas basado en el aprendizaje Q mejorado para mejorar la eficacia de la toma de decisiones sobre interferencias de radar. En primer lugar, el método adopta el criterio Metrópolis del algoritmo de recocido simulado (SA) para mejorar la estrategia de exploración, equilibrando la relación contradictoria entre la exploración y la utilización en el algoritmo para evitar caer en los óptimos locales. Al mismo tiempo, se introduce la idea del descenso de gradiente estocástico con reinicios en caliente (SGDR) para mejorar la tasa de aprendizaje del algoritmo, lo que reduce la oscilación y mejora la velocidad de convergencia en la última etapa de la iteración del algoritmo. A continuación, se construye un modelo de toma de decisiones de interferencia electrónica cognitiva y se dan los pasos específicos del algoritmo de aprendizaje Q mejorado. El experimento de simulación toma como ejemplo un radar multifuncional para analizar la influencia de la estrategia de exploración y la tasa de aprendizaje en el rendimiento de la toma de decisiones. Los resultados revelan que, en comparación con el algoritmo de aprendizaje Q tradicional, el algoritmo de aprendizaje Q mejorado propuesto en este trabajo puede explorar completamente y utilizar de forma eficiente y converger los resultados a una solución mejor a una velocidad más rápida. El número de iteraciones puede reducirse a más del 50%, lo que demuestra la viabilidad y eficacia del método aplicado a la toma de decisiones sobre interferencias electrónicas cognitivas.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Instrumentación y control de un secador de fruta tipo túnel
Artículo:
Tratamiento del retraso ionosférico para la navegación relativa mediante GPS diferencial en fase portadora
Tesis:
Diseño de un sistema de automatización para el sistema de iluminación de una planta industrial
Artículo:
Un nuevo método de clasificación de señales de flutter basado en la CNN y la STFT
Artículo:
Compensación de la dinámica cruzada de los sistemas de actuación de doble cuerda trenzada