%0 Journal Article %T 一种面向cpu-gpu异构系统的容错方法 %A 徐新海? %A 杨学军? %A 林宇斐? %A 林一松? %A 唐滔? %J 软件学报 %P 2538-2552 %D 2011 %R 10.3724/SP.J.1001.2011.04058 %X 近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphicsprocessingunit,简称gpu)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,gpu先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于cpu-gpu异构系统容错技术的研究工作主要将gpu从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向cpu-gpu异构系统的lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的lazyft容错方法对gpgpu(generalpurposecomputationongraphicshardware)程序进行容错处理,可以明显降低容错代价. %K gpgpu %K 异构系统 %K 容错 %K lazy %K 策略 %K 检查点 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=4058&flag=1