|
图书情报工作 2012
基于特殊主题的pagerank改进算法Keywords: 主题漂移,pagerank算法,领域向量,锚文本 Abstract: ?在传统pagerank算法的基础上进行一些优化与改进,提出一种新的主题敏感的pagerank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为pagerank算法加入时间因子来防止pagerank偏重旧网页的问题,加入站内外区分因子来防止针对pagerank算法作弊的行为.改进算法弥补了原算法的不足,提高了主题搜索的效率.
|