Este documento propone un método de locomoción dirigido por objetivos para un robot en forma de serpiente en un entorno 3D complejo basado en el aprendizaje por refuerzo de integral de trayectoria. Este método utiliza un algoritmo de Q-learning en línea sin modelo para evaluar estrategias de acción y optimizar la toma de decisiones a través de procesos repetidos de exploración-aprendizaje-utilización para completar la locomoción dirigida por objetivos del robot en forma de serpiente en un entorno 3D complejo. Los parámetros de control de locomoción adecuados, como los ángulos de las articulaciones y las velocidades de accionamiento del tornillo, pueden ser aprendidos mediante el aprendizaje por refuerzo de integral de trayectoria, y los parámetros aprendidos se transfirieron con éxito al robot en forma de serpiente. Los resultados de la simulación muestran que la trayectoria planificada puede evitar todos los obstáculos y llegar al destino de manera suave y rápida.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Superficies de una Curvatura Constante Negativa
Artículo:
- Bien planteado para problemas de desigualdad cuasivariacional
Artículo:
El Índice de Kirchhoff de Algunas Redes Combinatorias
Artículo:
Múltiplos Perpetuos Aumentados Exactos: Corolario sobre sistemas mecánicos diferentes con movimientos exactamente iguales
Artículo:
Función de partición exacta para el recorrido aleatorio de un campo electrostático
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo