%0 Journal Article %T 基于opencl的归约算法优化 %A 颜深根? %A 张云泉? %A 龙国平? %A 李焱? %J 软件学报 %P 163-171 %D 2011 %X 归约算法在科学计算和图像等领域有着广泛应用,系统研究了在opencl框架下,归约算法在gpu上的跨平台性能优化.已有研究工作一般只侧重单个硬件架构,基于opencl从向量化、片上存储体冲突、线程组织方式和指令选择优化等多个优化角度系统考察了不同优化方法在gpu硬件平台的影响.具体以minmax函数为例,对每种优化方法进行了详细的性能分析,并给出了提高性能的原因.在amdgpu和nvidiagpu平台分别测试的结果表明,优化后的算法在两个平台上都能实现很好的性能加速.在amdatiradeonhd5850平台上,int和float类型数据带宽利用最高达到了实测带宽的89%.在nvidiagputeslac2050平台上,性能也达到了cuda版本的相应函数性能的1.3~1.9倍. %K gpu %K 并行归约 %K opencl %K cuda %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=11037&flag=1