%0 Journal Article %T plasma自适应调优与性能优化的设计与实现 %A 吕渐春 %A 张云泉 %A 王 婷 %A 肖玄基? %J 计算机科学 %D 2012 %X plasma是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但plasma仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的lapack和plasma的实现机制,分析了plasma中存在的优势和不足,介绍了两种弥补plasma自身不足的方法。针对plasma的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了plasma性能,最后通过大量的测试验证了该优化方法的效果。 %K lapack %K plasma %K 自适应调优 %K 优化 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120466&flag=1