%0 Journal Article %T gpu矩阵乘法的性能定量分析模型 %A 尹孟嘉? %A 许先斌? %A 熊曾刚? %A 张 涛? %J 计算机科学 %D 2015 %X 性能评价和优化是设计高效率并行程序必不可少的重要工作,存储系统的性能高低直接影响到处理器的整体性能。利用gpgpu-sim对gpu的存储层次结构进行了模拟,找出了sm数量与存储控制器数量之间最佳配置关系。矩阵乘法是科学计算领域中的基本组成部分,是一种具有计算和访存密集特点的典型应用,其性能是gpu高性能计算的一个重要指标。性能模型作为并行系统性能评价的新的技术解决方案,具有许多其它性能评价方法无法比拟的优势。建立了一个性能模型,模型通过对指令流水线、共享存储器访存、全局存储器访存进行定量分析,找到了程序运行瓶颈,提高了执行速度。实验证明,该模型具有实用性,并有效地实现了矩阵乘法的优化。 %K gpu %K gpgpu-sim %K 矩阵乘法 %K 性能定量分析模型 %K 指令流水线 %K 共享存储器访存 %K 全局存储器访存 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=20151203&flag=1