%0 Journal Article %T 魂芯DSP高效访存并行FFT算法研究 %A 杨振浩 %A 王向前 %A 邓文齐 %A 郑启龙 %J 中山大学学报(自然科学版) %D 2018 %X 摘要 魂芯DSP(BWDSP)系列处理器由中国电子科技集团第38研究所研制,支持VLIW(Very Long Instruction Word,超长指令字)和SIMD(Single Instruction Multiple Data,单指令多数据流)技术,被广泛运用于各种高性能计算领域.快速傅里叶变换(Fast Fourier Transform,FFT)是数字信号处理、图像处理等领域的基本研究工具.目前由于BWDSP处理器的访存带宽限制,通用的向量化FFT算法未能充分挖掘其计算资源,面临算法性能较低的问题.针对该问题,本文结合BWDSP处理器的体系结构特征深入剖析FFT算法,提出了支持高效访存的并行FFT算法.实验结果表明,在BWDSP100处理器上该算法平均性能达到7.61Gflops,是串行FFT的16.54倍,普通向量化FFT的4.03倍. %K 位反序寻址 %K BWDSP %K FFT %K 向量化 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4502.shtml