Los algoritmos de aprendizaje por refuerzo para robots múltiples se vuelven muy lentos cuando aumenta el número de robots, lo que provoca un aumento exponencial del espacio de estados. Se presenta un aprendizaje Q secuencial basado en el intercambio de conocimientos. El repositorio de reglas de comportamiento de los robots se inicializa en primer lugar en el proceso de aprendizaje por refuerzo. Los robots móviles obtienen el estado actual del entorno mediante sensores. A continuación, se compara el estado para determinar si la regla de comportamiento relevante se ha almacenado en la base de datos. Si la regla está presente, se elegirá una acción de acuerdo con el conocimiento y las reglas, y se refinará el peso de la coincidencia. En caso contrario, la nueva regla se añadirá a la base de datos. Los robots aprenden según una secuencia determinada y comparten la base de datos de comportamientos. Examinamos el algoritmo mediante el comportamiento de seguimiento-rodeo de varios robots y descubrimos que el algoritmo mejorado puede acelerar eficazmente la velocidad de convergencia.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Un marco de fusión de datos multisensor en línea para la clasificación de emisores de radar
Artículos:
Minimización de la rugosidad superficial y la vibración de la herramienta en el fresado CNC
Artículos:
Controlador robusto y suave basado en modos deslizantes con convergencia en tiempo fijo para misiles considerando la incertidumbre aerodinámica
Artículos:
Diseño de un control PID difuso multirregional supervisor de reactores de pH
Artículos:
Optimización de colas de espera con interrupción de vacaciones bajo política N
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.