Biblioteca122.294 documentos en línea

Artículo

Research on Dynamic Path Planning of Wheeled Robot Based on Deep Reinforcement Learning on the Slope GroundInvestigación sobre la planificación dinámica de trayectorias de robots con ruedas basada en el aprendizaje profundo por refuerzo en terrenos en pendiente

Resumen

El algoritmo existente de planificación dinámica de trayectorias no puede resolver adecuadamente el problema de la planificación de trayectorias de robots con ruedas en terrenos inclinados con obstáculos móviles dinámicos. Para resolver el problema de la baja tasa de convergencia en la fase de entrenamiento de DDQN, se propone el algoritmo de planificación de trayectorias dinámicas basado en la Red Q Doble de Árbol (TDDQN). El algoritmo descarta las trayectorias detectadas incompletas y sobre-detectadas optimizando la estructura del árbol, y combina el método DDQN con el método de estructura de árbol. En primer lugar, se utiliza el algoritmo DDQN para seleccionar la mejor acción en el estado actual después de realizar menos acciones, para así obtener la trayectoria candidata que cumple con las condiciones. Y luego, de acuerdo con el estado obtenido, el proceso anterior se repite para formar múltiples trayectorias de la estructura de árbol. Finalmente, se utiliza el método de supresión no máxima para seleccion

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento