|
软件学报 2005
可恢复的软件dsm系统jiackpt, PP. 165-173 Keywords: 软件dsm系统,检查点,全局一致状态,jiajia Abstract: 软件dsm(distributedsharedmemory)系统在机群上构造了共享存储编程环境,结合了共享存储的易编程性和机群的可扩展性,引起了广泛的研究.由于软件dsm系统是一个分布式系统,系统失败风险大,需要实现容错技术以促进其实用化.利用用户级检查点技术,在支持域存储一致模型的软件dsm系统jiajia的基础上,设计并实现了一个可恢复的高可移植的软件dsm系统jiackpt(jiajiawithcheckpointing).由于采用适合软件dsm系统的强全局一致状态以及多种优化措施,jiackpt易于实现且获得很好的性能.在一个8节点的pc机群上的应用测试表明,即使每分钟做一次检查点,大部分应用的检查点开销也小于10%.此外,jiackpt还具有高可移植性.这些都表明jiackpt已经成为一个比较实用的系统.
|