%0 Journal Article
%T Implementation and Optimization of the FFT Using OpenCL on Heterogeneous Platforms
异构平台上基于OpenCL的FFT实现与优化
%A LI Yan
%A ZHANG Yun-quan
%A WANG Ke
%A ZHAO Mei chao
%A
李焱
%A 张云泉
%A 王可
%A 赵美超
%J 计算机科学
%D 2011
%I
%X 快速傅立叶变换作为20世纪公认的最重要的基础算法之一,在大规模科学计算处理、数字信号处理、图形图像仿真等众多领域有着广泛的应用。OpenCL是首个面向异构系统通用的并行编程标准,为软件开发人员提供了统一的面向异构系统的并行编程环境。首先,在异构平台Cell和GPU上使用OpcnCL实现了基于2的幂一维FFT,并 对其进行了测试和分析,在Cell平台上当数据规模适中时它能够达到SDK性能的65%,当数据规模继续增大时,相对性能有所降低。此外,针对Nvidia Fermi平台,手工调优了小因子的FFT,使其性能接近于CUFFT的140%。
%K FFT
%K OpenCL
%K Cell
%K CUDA
%K GPU
%K Fast fourier transform
FFT
%K OpcnCL
%K Cell
%K CUDA
%K GPU,快速傅立叶变换
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=2AC66EB828B1E4357761441B9C1F464A&yid=9377ED8094509821&vid=16D8618C6164A3ED&iid=5D311CA918CA9A03&sid=03E56C113B4E5A88&eid=86B72045A5A32064&journal_id=1002-137X&journal_name=计算机科学&referenced_num=0&reference_num=0