|
软件学报 2014
大数据下基于异步累积更新的高效p-rank计算方法DOI: 10.13328/j.cnki.jos.004637, PP. 2136-2148 Keywords: 异步累积更新,大数据,相似度,p-rank,大规模计算 Abstract: p-rank是simrank的扩展形式,也是一种相似度度量方法,被用来计算网络中任意两个结点的相似性.不同于simrank只考虑结点的入度信息,p-rank还加入了结点的出度信息,从而更加客观准确地评价结点间的相似程度.随着大数据时代的到来,p-rank需要处理的数据日益增大.使用mapreduce等分布式模型实现大规模p-rank迭代计算的方法,本质上是一种同步迭代方法,不可避免地具有同步迭代方法的缺点:迭代时间(尤其是迭代过程中处理器等待的时间)长,计算速度慢,因此效率低下.为了解决这一问题,采用了一种迭代计算方法——异步累积更新算法.这个算法实现了异步计算,减少了计算过程处理器结点的等待时间,提高了计算速度,节省了时间开销.从异步的角度实现了p-rank算法,将异步累积更新算法应用在了p-rank上,并进行了对比实验.实验结果表明该算法有效地提高了计算收敛速度.
|