|
计算机科学 2014
一种准对角矩阵的混合压缩算法及其与向量相乘在gpu上的实现DOI: 10.11896/j.issn.1002-137X.2014.07.060 Keywords: 图形处理芯片,稀疏矩阵,稀疏矩阵与向量相乘,cuda中图法分类号tp311文献标识码a Abstract: 稀疏矩阵与向量乘(spmv)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,提出一种混合对角存储(dia)和行压缩存储(csr)格式来进行spmv计算,对于分割出来的对角线区域之外的离散非零元素采用csr存储,这样能够克服dia在不规则情况下存储矩阵的列迅速增加的缺陷,同时对角线采用dia存储又能充分利用矩阵的对角特征,以减少csr的行非零元素数目的不均衡现象,并可以通过调整存储对角线的带宽来适应准对角矩阵的不同的离散形式,以获得比dia和csr更高的压缩比,减小计算的数据规模。利用cuda平台在gpu上进行了实验测试,结果表明该方法比dia和csr具有更高的加速比。
|