El lenguaje de programación C Paralelo Unificado (UPC) ofrece paralelismo a través de una memoria compartida lógicamente particionada, que generalmente abarca subsistemas de memoria físicamente disjuntos. Una característica conveniente de UPC es su capacidad para ejecutar automáticamente el movimiento de datos entre hilos, de modo que todo el contenido de una matriz de datos compartida parezca ser libremente accesible por todos los hilos. La amigabilidad del programador, sin embargo, puede tener como costo penalidades de rendimiento sustanciales. Esto es especialmente cierto al indexar indirectamente los elementos de una matriz compartida, para los cuales la comunicación de datos entre hilos inducida puede ser irregular y tener un patrón de granularidad fina. En este documento, estudiamos estrategias de mejora de rendimiento que apuntan específicamente a dicha comunicación irregular de granularidad fina en UPC. Comenzando desde la privatización explícita de hilos, continuando con la comunicación por bloques, y llegando a la condensación y consolidación de mensajes, obtuvimos una mejora considerable
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Control Difuso Basado en Observador de Perturbaciones para un Manipulador de Robot Utilizando un Modelo Neuromusculoesquelético Impulsado por EMG
Artículo:
Un algoritmo de combinación de doble capa para el problema de diseño de redes de intercambio de información en tiempo real.
Artículo:
Extracción de la estructura de enlaces ocultos de los flujos de distribución para una red social espacial.
Artículo:
Implementación en pipeline de PSO polifásico para algoritmo de beamforming adaptativo
Artículo:
Modelo comunitario integrado inteligente para zonas de minorías étnicas mediante análisis de datos y aprendizaje automático