全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于gpu的稀疏线性系统的预条件共轭梯度法

Keywords: 图形处理器,稀疏线性方程组,预条件共轭梯度法,压缩稀疏行,统一计算设备架构

Full-Text   Cite this paper   Add to My Lib

Abstract:

?研究了基于gpu的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(cuda)平台编制了程序,在nvidiagt430gpu平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(csr)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于gpu的稀疏矩阵与向量相乘的性能优化、数据从cpu端传到gpu端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和cusparse函数库中的cusparsedcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用cublas库和cusparse库实现的算法稍具优势,与cpu端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133