|
软件学报 2010
大规模集群中一种自适应可扩展的rpc超时机制, PP. 3199-3210 Keywords: 远程过程调用,失效检测,超时,大规模,扩展性,响应性,可靠性 Abstract: 在基于rpc(remoteproducecall)构建的分布式系统中,超时是一种通用的失效检测手段.在超大规模lustre存储集群的压力测试中,发现传统的固定超时机制会导致很多不必要的超时而存在缺陷.提出了一种综合考虑了网络条件、服务器负载、扩展性和性能等因素的自适应可扩展的rpc超时机制(adaptivescalablerpctimeoutmechanism,简称ast).在其控制下,客户端超时值可以根据网络和服务器的拥塞情况动态地调整设置,而且服务器可以通过额外消息传递通知客户端修改原超时值.经过一系列的模拟和验证,其结果表明,ast是一种更适合的rpc失效检测模型,增强了系统的响应性、可靠性和稳定性,而且对系统的性能没有过大的负面影响.
|