Biblioteca122.739 documentos en línea

Artículo

Efficient CSR-Based Sparse Matrix-Vector Multiplication on GPUMultiplicación eficiente de matrices y vectores dispersos basada en CSR en la GPU

Resumen

La multiplicación de matrices y vectores dispersos (SpMV) es una operación importante en la ciencia computacional y necesita ser acelerada porque a menudo representa el coste dominante en muchos métodos iterativos y problemas de valores propios ampliamente utilizados. Logramos este objetivo proponiendo un novedoso algoritmo de SpMV basado en la fila dispersa comprimida (CSR) en la GPU. Nuestro método asigna dinámicamente distintos números de filas a cada bloque de hilos y ejecuta distintas implementaciones de optimización en función del número de filas que implique para cada bloque. El proceso de accesos a las matrices CSR está totalmente coalescido y el ancho de banda de la DRAM de la GPU se utiliza de forma eficiente cargando los datos en la memoria compartida, lo que alivia el cuello de botella de muchos algoritmos existentes basados en CSR (es decir, CSR-escalar y CSR-vectorial). Los resultados de las pruebas realizadas en GPUs C2050 y K20c demuestran que nuestro método supera a un algoritmo de CSR perfecta que inspira nuestro trabajo, a los algoritmos CUSPARSE V6.5 y CUSP V0.5.1 ajustados por el fabricante y a tres algoritmos populares clSpMV, CSR5 y CSR-Adaptive.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento