La planificación de trayectorias dinámicas en un entorno desconocido siempre ha sido un desafío para los robots móviles. En este documento, aplicamos el aprendizaje profundo de refuerzo doble Q-network (DDQN) propuesto por DeepMind en 2016 a la planificación de trayectorias dinámicas en un entorno desconocido. Se diseñan la función de recompensa y castigo y el método de entrenamiento para la inestabilidad de la etapa de entrenamiento y la escasez del espacio de estado del entorno. En diferentes etapas de entrenamiento, ajustamos dinámicamente la posición de inicio y la posición objetivo. Con la actualización de la red neuronal y el aumento de la probabilidad de regla codiciosa, el espacio local buscado por el agente se expande. Se utiliza el módulo Pygame en PYTHON para establecer entornos dinámicos. Considerando la señal de lidar y la posición objetivo local como entradas, se utilizan redes neuronales convolucionales (CNNs) para generalizar el estado ambiental. El algoritmo Q-learning mejora la capacidad de evitar obstáculos dinámicos y la planificación local de los agentes en el entorno. Los resultados muestran que, después de entrenar en diferentes entornos dinámicos y probar en un nuevo entorno, el agente puede llegar con éxito a la posición objetivo local en un entorno dinámico desconocido.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Detección de bordes de imágenes RGB-D basada en bosques estructurados
Artículo:
Sensores ópticos bimodales asequibles para extender el uso de la vigilancia automatizada de insectos
Artículo:
Método Espectrofluorimétrico Rápido, Sencillo y Sensible para la Estimación de Ganciclovir en Formulaciones a Granel y Farmacéuticas
Artículo:
Eliminación en proceso de glucósidos de esterol mediante ultrafiltración en la producción de biodiésel
Artículo:
Defensa frente a las amenazas biológicas: El papel fundamental de la bioseguridad
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones