%0 Journal Article
%T Parallel optimize technology based on GPU
基于GPU的并行优化技术*
%A ZUO Hao-rui
%A ZHANG Qi-heng
%A XU Yong
%A ZHAO Ru-jin
%A
左颢睿
%A 张启衡
%A 徐勇
%A 赵汝进
%J 计算机应用研究
%D 2009
%I
%X 针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。
%K graphics processor unit(GPU)
%K parallel optimize
%K reduction
%K compute unified device architecture(CUDA)
图形处理器
%K 并行优化
%K 累加和
%K 统一计算设备架构
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=89C87E017CE712FBB5BC93D88EC27244&yid=DE12191FBD62783C&vid=96C778EE049EE47D&iid=708DD6B15D2464E8&sid=62D47F65A7841A5F&eid=2BDCB4EC5A5F22BE&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=1&reference_num=12