Este artículo aborda una nueva estrategia de comportamiento basada en aprendizaje automático utilizando el algoritmo de deep Q-learning para la plataforma de simulación RoboCode. Según esta estrategia, se propone un nuevo modelo para la plataforma RoboCode, proporcionando un entorno para robots simulados que pueden ser programados para luchar contra otros robots. En comparación con los Juegos de Atari, RoboCode tiene un conjunto bastante amplio de acciones y situaciones. Debido a los desafíos de entrenar un modelo de CNN para un problema de espacio de acción continuo como este, las entradas obtenidas del entorno de simulación se generaron dinámicamente, y el modelo propuesto fue entrenado utilizando estas entradas. El modelo entrenado luchó contra los robots rivales predefinidos del entorno (robots estándar) beneficiándose acumulativamente de la experiencia de estos robots. La comparación entre el modelo propuesto y los robots estándar de la plataforma RoboCode fue verificada estadísticamente. Finalmente, el rendimiento del modelo propuesto se comparó con robots personalizados basados en aprendizaje automático
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un Análisis Comparativo de Turbinas Autocorrectoras para la Planta de Energía de Columna de Agua Oscilante de Mutriku
Artículo:
Detección de saliencia a través del método mejorado de análisis de componentes principales jerárquico.
Artículo:
Flujo Medio Ponderado Consistente del Método de Galerkin Discontinuo TVD-RK Bien Equilibrado para Flujos en Aguas Poco Profundas
Artículo:
Sistemas de antenas para el Internet de los objetos
Artículo:
Investigación sobre un modelo antispoofing facial multimodal basado en ataques adversarios
Artículo:
Medicina de la conservación ¿una disciplina para médicos veterinarios?
Libro:
Tratamiento de aguas para consumo humano : plantas de filtración rápida. Manual II : diseño de plantas de tecnología apropiada
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza
Showroom:
Panel fotovoltaico: Dimensionamiento y funcionamiento