%0 Journal Article %T Implementation and Optimization of the FFT Using OpenCL on Heterogeneous Platforms
异构平台上基于OpenCL的FFT实现与优化 %A LI Yan %A ZHANG Yun-quan %A WANG Ke %A ZHAO Mei chao %A
李焱 %A 张云泉 %A 王可 %A 赵美超 %J 计算机科学 %D 2011 %I %X 快速傅立叶变换作为20世纪公认的最重要的基础算法之一,在大规模科学计算处理、数字信号处理、图形图像仿真等众多领域有着广泛的应用。OpenCL是首个面向异构系统通用的并行编程标准,为软件开发人员提供了统一的面向异构系统的并行编程环境。首先,在异构平台Cell和GPU上使用OpcnCL实现了基于2的幂一维FFT,并 对其进行了测试和分析,在Cell平台上当数据规模适中时它能够达到SDK性能的65%,当数据规模继续增大时,相对性能有所降低。此外,针对Nvidia Fermi平台,手工调优了小因子的FFT,使其性能接近于CUFFT的140%。 %K FFT %K OpenCL %K Cell %K CUDA %K GPU %K Fast fourier transform
FFT %K OpcnCL %K Cell %K CUDA %K GPU,快速傅立叶变换 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=2AC66EB828B1E4357761441B9C1F464A&yid=9377ED8094509821&vid=16D8618C6164A3ED&iid=5D311CA918CA9A03&sid=03E56C113B4E5A88&eid=86B72045A5A32064&journal_id=1002-137X&journal_name=计算机科学&referenced_num=0&reference_num=0