%0 Journal Article
%T Uniprocessor Performance Tuning of a Structured Grid Based Parallel CFD Application
一个结构网格并行CFD程序的单机性能优化
%A 车永刚
%A 张理论
%A 王勇献
%A 徐传福
%A 刘巍
%A 王正华
%A 刘化勇
%J 计算机科学
%D 2013
%I
%X 从单机性能优化角度对一个高阶精度结构网格CFI)并行程序进行了优化。通过识别关键变量并对其进行 常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓 存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以 优化访存性能。在国家超算长沙中心“`Tianhe—lA',并行机上的测试结果表明,相对于采用Intel编译器最高优化级别 的版本,其对10。万网格点二维翼型算例,串行程序性能提高约22.2%-28.9%;对1. 12亿网格点三角翼算例,并行 程序性能提高约13.9%-20.2%。
%K Parallel CFD
%K Uniprocessor performance tuning
%K Kcy variable parameterization
%K Multi-level data buffering
CFD并行计算,单机性能优化,关键变量参数化,分级数据缓存
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=EEFFAAE7C668ACD1411FE1BE03EB6550&yid=FF7AA908D58E97FA&vid=1371F55DA51B6E64&iid=38B194292C032A66&sid=8477411EEDB08A86&eid=2B5DE8A23DCEED39&journal_id=1002-137X&journal_name=计算机科学&referenced_num=0&reference_num=0