Este documento propone un método de locomoción dirigido por objetivos para un robot en forma de serpiente en un entorno 3D complejo basado en el aprendizaje por refuerzo de integral de trayectoria. Este método utiliza un algoritmo de Q-learning en línea sin modelo para evaluar estrategias de acción y optimizar la toma de decisiones a través de procesos repetidos de exploración-aprendizaje-utilización para completar la locomoción dirigida por objetivos del robot en forma de serpiente en un entorno 3D complejo. Los parámetros de control de locomoción adecuados, como los ángulos de las articulaciones y las velocidades de accionamiento del tornillo, pueden ser aprendidos mediante el aprendizaje por refuerzo de integral de trayectoria, y los parámetros aprendidos se transfirieron con éxito al robot en forma de serpiente. Los resultados de la simulación muestran que la trayectoria planificada puede evitar todos los obstáculos y llegar al destino de manera suave y rápida.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Colocación óptima de sensores para la supervisión sanitaria de estructuras de gran altura basada en algoritmos genéticos
Artículo:
Modelo de evaluación del índice de calidad del MPP vendido en la plataforma de comercio electrónico
Artículo:
Investigación sobre la Integración de LRP de la Logística de Comercio Electrónico en el Contexto de la Integración de Recolección y Distribución.
Artículo:
El Método -Transform y los Operadores de Diferencia Fraccional Tipo Delta
Artículo:
Modelo biobjetivo de programación logística de emergencias basado en condiciones de tráfico inciertas