全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2010 

blas库在多核处理器上的性能测试与分析

, PP. 214-223

Keywords: blas,体系结构,多核并行,x86,gotoblas,atlas,mkl,acml,优化

Full-Text   Cite this paper   Add to My Lib

Abstract:

blas库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着cpu多核化的发展,blas的多核并行性能已经变得比与体系结构相关的单核性能更加重要.实验以流行于高性能计算的xeon、opteron系列多核x86处理器为例,全面测试了gotoblas、atlas、mkl和acml四种主流的blas库的所有1,2,3级函数,并覆盖了不同计算规模和多核并行方面的测试.通过测试结果,分析源代码、blas库资料和论文的方式,分析blas有效的优化和并行方法,以及它们所适合的平台.为blas的优化、使用,甚至高性能处理器的发展上提供有益的建议.实验结果表明,比起一个逻辑处理强大但是复杂的处理器,一个cache更大、性能更好,内存带宽更宽、延迟更小,主频更高的处理器往往能在高性能计算中取得更好的性能.同时,x86平台上的状况对其他体系结构也有巨大的借鉴意义.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133