%0 Journal Article %T 一种利用并行复算实现的openmp容错机制 %A 富弘毅? %A 丁滟? %A 宋伟? %A 杨学军? %J 软件学报 %P 411-427 %D 2012 %R 10.3724/SP.J.1001.2012.03919 %X 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对openmp并行程序的容错机制pr-omp,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对openmp并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持pr-omp的编译工具gift-omp,并通过实验证明了pr-omp机制及其支持工具的有效性,评估并分析了其性能和可扩展性. %K 容错 %K openmp %K 并行复算 %K 数据流分析 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=3919&flag=1