|
计算机科学 2011
异构平台上基于opencl的fft实现与优化Keywords: fft,opcncl,cell,cuda,gpu,快速傅立叶变换 Abstract: 快速傅立叶变换作为20世纪公认的最重要的基础算法之一,在大规模科学计算处理、数字信号处理、图形图像仿真等众多领域有着广泛的应用。opencl是首个面向异构系统通用的并行编程标准,为软件开发人员提供了统一的面向异构系统的并行编程环境。首先,在异构平台cell和gpu上使用opcncl实现了基于2的幂一维fft,并对其进行了测试和分析,在cell平台上当数据规模适中时它能够达到sdk性能的65%,当数据规模继续增大时,相对性能有所降低。此外,针对nvidiafermi平台,手工调优了小因子的fft,使其性能接近于cufft的140%。
|