|
软件学报 2012
一种利用并行复算实现的openmp容错机制DOI: 10.3724/SP.J.1001.2012.03919, PP. 411-427 Keywords: 容错,openmp,并行复算,数据流分析 Abstract: 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对openmp并行程序的容错机制pr-omp,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对openmp并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持pr-omp的编译工具gift-omp,并通过实验证明了pr-omp机制及其支持工具的有效性,评估并分析了其性能和可扩展性.
|