%0 Journal Article %T 基于opencl的图像模糊化算法优化研究 %A 张樱 %A 张云泉 %A 龙国平? %J 计算机科学 %D 2012 %X 现代cpu一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(cuda,opencl)都定义了特定程序设计接口(cuda的纹理内存,c)pencl的图像对象)以便图像应用能利用相关硬件支持。以典型图像模糊化处理算法在amd平台cpu的优化为例,探讨了〔)pcnci、的图像对象在图像算法优化上的适用范围,尤其是分析了其相对于更通用的基于全局内存加片上局部存储进行性能优化的方法的优劣。实验结果表明,图像对象只有在图像为四通道且计算过程中需要缓存的数据量较小时才能带来较好的性能改善,其余情况采用全局内存加局部存储都能获得较好性能。优化后的算法性能相对于精心实现的cpu版加速比为200-}-1000;相对于nvidianpp库相应函数的性能加速比为1.3~。 %K amdgpu %K blur %K opcnci %K 图像对象 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120359&flag=1