Los vehculos de superficie no tripulados (USV) se han utilizado ampliamente en investigacin y exploracin, patrulla y defensa. La navegacin autnoma y la evitacin de obstculos, como tecnologa esencial de los USV, son las condiciones clave para el xito en la ejecucin de las misiones. Sin embargo, el modelado fino de los algoritmos convencionales no puede satisfacer la estrategia de control preciso del comportamiento en tiempo real de los USV en entornos complejos, lo que supone un gran reto para la poltica de control autnomo. En este artculo, se propone un mtodo UANOA (navegacin autnoma y evasin de obstculos de USVs) basado en el aprendizaje por refuerzo profundo. El UANOA logra la tarea de navegacin autnoma de los USVs mediante la deteccin en tiempo real de informacin parcialmente compleja del ocano alrededor y la salida en tiempo real de los comandos de control del ngulo del timn de los USVs. En nuestro trabajo, empleamos una red doble para lograr un control de extremo a extremo desde la entrada bruta del sensor hasta la salida de la accin discreta del timn, y diseamos un conjunto de funciones de recompensa que pueden adaptarse a la navegacin de los USV y a la evitacin de obstculos. Para aliviar el sesgo de decisin causado por la observacin parcial de los USV, utilizamos las redes de memoria a corto plazo (LSTM) para mejorar la capacidad de recordar el entorno ocenico de los USV. Los experimentos demuestran que UANOA garantiza que un USV llegue a los puntos objetivo con una planificacin de ruta ptima en entornos ocenicos complejos sin que se produzca ninguna colisin, y UANOA supera a la red profunda (DQN) y a la poltica de control aleatoria en velocidad de convergencia, distancia de navegacin, consumo de direccin del ngulo del timn y otras mediciones de rendimiento.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Modelo de pronóstico de combinación adaptativa basado en el grado de correlación de área con aplicación al consumo de energía en China.
Artículo:
Análisis multivariado no lineal y predicción del mercado de valores de Shanghai
Artículo:
Diseño de control retroalimentado lineal basado en DII para la sincronización práctica de sistemas caóticos con no linealidad de entrada incierta y aplicación a la comunicación segura.
Artículo:
Aprovechamiento de recursos de innovación para productos modulares en escenarios de innovación abierta utilizando el método de distancia difusa.
Artículo:
Gestión óptima de la energía basada en juegos con energías renovables para la carga segura de vehículos eléctricos en el Internet de las Cosas