La resolucin de sistemas triangulares es el componente bsico del algoritmo GMRES precondicionado. El preacondicionamiento inexacto resulta atractivo por su alto paralelismo en aceleradores. En este trabajo, proponemos e implementamos una solucin iterativa e inexacta de bloques triangulares en multi-GPUs basada en el marco PETScs. Adems, mediante el desarrollo de un procedimiento distribuido de multiplicacin vectorial de matrices dispersas por bloques y la investigacin de las operaciones vectoriales optimizadas, formamos el GMRES precondicionado habilitado para multi-GPU con el precondicionador Jacobi por bloques. En la implementacin, se emplea la tcnica GPU-Direct para evitar las copias de memoria del dispositivo anfitrin. El paso de preacondicionamiento utilizado por la estructura PETScs y la biblioteca cuSPARSE tambin se investigan para realizar comparaciones de rendimiento. Los experimentos muestran que el GMRES desarrollado con preacondicionamiento inexacto en 8 GPUs puede alcanzar hasta 4,4 veces ms velocidad que la implementacin realizada slo en CPU con preacondicionamiento exacto utilizando 8 procesos MPI.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estabilidad Asintótica Uniforme Global de una Clase de Sistemas Lineales Conmutados con un Número Infinito de Subsistemas.
Artículo:
Sobre la Periodicidad de una Ecuación de Diferencias con Máximo
Artículo:
Transiciones inducidas por el ruido en un modelo de crecimiento de la población basado en la capacidad de carga dependiente del tamaño
Artículo:
Un Nuevo Método para la Investigación del Problema Centro-Foco de Sistemas Diferenciales
Artículo:
Estrategia de mutación basada en el tamaño del paso y la tasa de supervivencia para la programación evolutiva