|
计算机科学 2013
单节点多gpu集群下hpl动态负载均衡优化Abstract: 现有cpu加速的高性能linpack基准测试程序(hpl)一般采用基于实际运算能力的动态负载均衡算法来实现。然而该算法在单节点多gpu的平台上表现不佳,其原因是单节点多gpu平台上单个gpu计算量小,并且gpu与cpu的总性能差距较大。为此,提出了经验指导的动态负载均衡算法以及多gpu自适应负载均衡算法,并且在单节点多gpu平台上进行了验证,结果显示,其比现有的基于nvidia费米gpu的hpi有6.3%的加速效果。
|