Este artículo aborda una nueva estrategia de comportamiento basada en aprendizaje automático utilizando el algoritmo de deep Q-learning para la plataforma de simulación RoboCode. Según esta estrategia, se propone un nuevo modelo para la plataforma RoboCode, proporcionando un entorno para robots simulados que pueden ser programados para luchar contra otros robots. En comparación con los Juegos de Atari, RoboCode tiene un conjunto bastante amplio de acciones y situaciones. Debido a los desafíos de entrenar un modelo de CNN para un problema de espacio de acción continuo como este, las entradas obtenidas del entorno de simulación se generaron dinámicamente, y el modelo propuesto fue entrenado utilizando estas entradas. El modelo entrenado luchó contra los robots rivales predefinidos del entorno (robots estándar) beneficiándose acumulativamente de la experiencia de estos robots. La comparación entre el modelo propuesto y los robots estándar de la plataforma RoboCode fue verificada estadísticamente. Finalmente, el rendimiento del modelo propuesto se comparó con robots personalizados basados en aprendizaje automático
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Diseño de Edificio Ecológico Basado en Gemelo Digital
Artículo:
Antena compacta de doble banda basada en metasuperficie para dispositivos médicos portátiles de red de área corporal
Artículo:
Diseñando interfaces de usuario tangibles para teléfonos con NFC
Artículo:
Transmisión energéticamente eficiente basada en enlaces directos: Hacia una Internet de los objetos cooperativa y segura
Artículo:
Algoritmo de sincronización de tiempo basado en Edge Computing en redes de sensores inalámbricos (WSNs)