La unidad de procesamiento gráfico (GPU) ha obtenido un gran éxito en los cálculos científicos por su enorme potencia de cálculo y su gran ancho de banda de memoria. En este artículo se analiza la forma eficiente de implementar el solver de gradiente conjugado precondicionado polinómico para el cálculo de la elasticidad por elementos finitos en GPUs NVIDIA utilizando la arquitectura de dispositivos unificados de cálculo (CUDA). Se introduce el formato ELLPACK de bloque rebanado (SBELL) para almacenar matrices dispersas derivadas de la discretización por elementos finitos de la elasticidad con menos ceros de relleno que los formatos tradicionales basados en ELLPACK. Se han investigado métodos de preacondicionamiento polinómico tanto en convergencia como en tiempo de ejecución. A partir del rendimiento global, se elige el método polinómico de mínimos cuadrados (L-S) como precondicionador en el solver PCG para ecuaciones de elementos finitos derivadas de la elasticidad por sus mejores resultados en diferentes mallas de ejemplo. En el solver PCG, se utiliza un algoritmo de precisión mixta no sólo para reducir los requisitos generales de cálculo, almacenamiento y ancho de banda, sino también para aprovechar al máximo la capacidad de los dispositivos GPU. Con el formato SBELL y el algoritmo de precisión mixta, el CG precondicionado L-S basado en GPU puede obtener una aceleración de entre 7 y 9 respecto a la implementación en CPU.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Teoría de Imágenes para Funciones de Neumann en la Geometría Esferoidal Prolata
Artículo:
Sobre la estabilidad de ecuaciones aditivas alternativas en espacios multi-normados
Artículo:
Controlador difuso Takagi-Sugeno y controlador de modo deslizante para un robot móvil no holonómico
Artículo:
Filtrado de video espaciotemporal basado en umbral adaptativo y agrupamiento
Artículo:
Eliminación de ruido moteado mediante modelos de energía con nueva configuración de regularización