%0 Journal Article %T Parallel optimize technology based on GPU
基于GPU的并行优化技术* %A ZUO Hao-rui %A ZHANG Qi-heng %A XU Yong %A ZHAO Ru-jin %A
左颢睿 %A 张启衡 %A 徐勇 %A 赵汝进 %J 计算机应用研究 %D 2009 %I %X 针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。 %K graphics processor unit(GPU) %K parallel optimize %K reduction %K compute unified device architecture(CUDA)
图形处理器 %K 并行优化 %K 累加和 %K 统一计算设备架构 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=89C87E017CE712FBB5BC93D88EC27244&yid=DE12191FBD62783C&vid=96C778EE049EE47D&iid=708DD6B15D2464E8&sid=62D47F65A7841A5F&eid=2BDCB4EC5A5F22BE&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=1&reference_num=12