%0 Journal Article %T 一种面向不确定图的SimRank算法 %A 董宇欣 %A 王莹洁 %A 宁鹏飞 %A 张耀元 %J 哈尔滨工程大学学报 %D 2014 %R 10.3969/j.issn.1006-7043.201305037 %X 针对以往的搜索引擎日志分析都主要集中在用户行为分析、查询推荐及搜索引擎评价等方面,采用社会网络分析法对搜索引擎进行日志分析。以不确定图的方式逻辑表示搜索引擎的日志中查询词和网页的链接关系,通过基于不确定图的SimRank算法,计算查询词与网页的相似度,最终以相似度和查询词的加权方式建立网页描述库。针对概率抽样的3点基本要求,提出一种渐进式的抽样策略,从而保证采用抽样技术对于不确定图中SimRank值计算的准确性。实验表明该算法具有较好的准确率和可行性。 %K 搜索引擎 %K 社会网络 %K 不确定图 %K SimRank %K 相似度 %K 抽样策略 %U http://heuxb.hrbeu.edu.cn/oa/darticle.aspx?type=view&id=20141114