Se presenta una técnica para paralelizar múltiples bucles en un sistema informático heterogéneo. Los bucles primero se desenrollan y luego se dividen en múltiples tareas que se asignan al hardware reconfigurable. Se aplica una optimización orientada al rendimiento para encontrar el mejor factor de desenrollado para cada bucle bajo restricciones de tamaño del hardware. El enfoque se demuestra utilizando tres aplicaciones: reconocimiento de voz, procesamiento de imágenes y el problema N-Body. Los resultados experimentales muestran que se logra una aceleración máxima de 34 en un FPGA de 274 MHz para el problema N-Body sobre un microprocesador de 2.6 GHz, lo cual es 4.1 veces mayor que el de un enfoque sin desenrollado.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Análisis del rendimiento del caché de retransmisión multisalto para Internet de las Cosas en canales Nakagami
Artículo:
Utilizando Afirmaciones Estadísticas para Guiar Sistemas Autoadaptativos
Artículo:
Métrica de aprendizaje híbrida basada en CNN multietiqueta para la reidentificación de peatones
Artículo:
Aplicación de un sistema de entrenamiento de baloncesto basado en una red dinámica de computación inteligente en la niebla
Artículo:
Innovación del servicio de seguros basada en datos en la era del Big Data mediante computación en la nube.