%0 Journal Article %T 一种支持容错的任务并行程序设计模型 %A 王一拙 %A 王小军 %A 石峰 %A 苏岩 %A 计卫星 %A 陈旭 %J - %D 2016 %R 10.13328/j.cnki.jos.004842 %X 任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能.提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为调度、执行、错误检测与恢复的基本单位,在应用级实现容错支持.采用一种Buffer-Commit计算模型支持瞬时错误的检测与恢复;采用应用级无盘检查点实现节点故障类型永久错误的恢复;采用一种支持容错的工作窃取任务调度策略获得动态负载均衡.实验结果表明,该模型以较低的性能开销提供了对硬件错误的容错支持 %K 并行程序设计 容错 任务并行 工作窃取调度 负载均衡 %U http://www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=4842&flag=1