Biblioteca122.739 documentos en línea

Artículo

Developing a Multi-GPU-Enabled Preconditioned GMRES with Inexact Triangular Solves for Block Sparse MatricesDesarrollo de un GMRES precondicionado multi-GPU con soluciones triangulares inexactas para matrices dispersas en bloque

Resumen

La resolucin de sistemas triangulares es el componente bsico del algoritmo GMRES precondicionado. El preacondicionamiento inexacto resulta atractivo por su alto paralelismo en aceleradores. En este trabajo, proponemos e implementamos una solucin iterativa e inexacta de bloques triangulares en multi-GPUs basada en el marco PETScs. Adems, mediante el desarrollo de un procedimiento distribuido de multiplicacin vectorial de matrices dispersas por bloques y la investigacin de las operaciones vectoriales optimizadas, formamos el GMRES precondicionado habilitado para multi-GPU con el precondicionador Jacobi por bloques. En la implementacin, se emplea la tcnica GPU-Direct para evitar las copias de memoria del dispositivo anfitrin. El paso de preacondicionamiento utilizado por la estructura PETScs y la biblioteca cuSPARSE tambin se investigan para realizar comparaciones de rendimiento. Los experimentos muestran que el GMRES desarrollado con preacondicionamiento inexacto en 8 GPUs puede alcanzar hasta 4,4 veces ms velocidad que la implementacin realizada slo en CPU con preacondicionamiento exacto utilizando 8 procesos MPI.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento