Back to Search Start Over

Evaluación y optimización de rutinas BLAS de nivel 3 para procesadores gráficos

Authors :
Barrachina Mir, Sergio
Castillo Catalán, Maribel
Igual, Francisco D.
Mayo, Rafael
Quintana-Orti, Enrique S.
Publication Year :
2008
Publisher :
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume I, 2008.

Abstract

The increase in performance of the last generations of graphics processors (GPUs) has made this class of platform a coprocessing tool with remarkable success in certain types of operations. In this paper we evaluate the performance of the Level 3 operations in CUBLAS, the implementation of BLAS for NVIDIA(R) GPUs with unified architecture. From this study, we gain insights on the quality of the kernels in the library and we propose several alternative implementations that are competitive with those in CUBLAS. Experimental results on a GeForce 8800 Ultra compare the performance of CUBLAS and the new variants El incremento en las prestaciones de las últimas generaciones de procesadores gráficos (GPUs), ha convertido a este tipo de plataformas en herramientas de coprocesamiento con notable éxito frente a cierto tipo de aplicaciones. En el presente artículo, se evalua el rendimiento de las operaciones de Nivel 3 de CUBLAS, la implementación de BLAS desarrollada por NVIDIA(R) para sus procesadores gráficos con arquitectura unificada. A partir del estudio, se extraen conclusiones acerca de la calidad de las implementaciones de la biblioteca, y se proponen implementaciones alternativas que mejoran el rendimiento de las implementaciones originales. Los resultados experimentales sobre una GeForce 8800 Ultra comparaen el rendimiento de CUBLAS y las nuevas variantes propuestas

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.od......1500..41c5bc177fe4b4ad2cb9b8769a539de6