%0 Journal Article %T 面向异构架构的混合精度有限元算法及其cuda实现 %A 刘建华 %A 王朝尉 %A 任江勇 %A 田荣? %J 计算机科学 %D 2012 %X 长期以来,单精度似乎与科学计算无缘,然而从体系结构看,混合精度计算可以充分发挥向量部件、c}pgpu设备的单精度性能,提供更高的效能,如降低通讯带宽要求、提高数据传输和通讯效率等。混合精度显格式有限元算法,结合材料强非线性多尺度有限元程序msfem,实现了gpgpu上的有效加速。实验结果表明:混合精度显格式有限元程序实现了90%以上的计算通过单精度完成,其计算结果与全部使用双精度的结果相一致。该算法可以使得在不支持双精度格式的加速卡上实现科学计算功能。在支持双精度浮点格式的gpu上,混合精度算法与全部采用双精度计算相比其加速效果提高了1.6~1.7倍。 %K gpgpu %K 混合精度算法 %K 有限元 %K 并行计算 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120673&flag=1