%0 Journal Article %T 基于用户搜索行为的query-doc关联挖掘 %A 朱亮 %A 陆静雅 %A 左万利 %J 自动化学报 %P 1654-1666 %D 2014 %R 10.3724/SP.J.1004.2014.01654 %X ?query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息.query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session数据,最终挖掘出点击日志中用户没有点击到的doc数据,从而预测出query和doc间的隐含关联关系,同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础. %K 关联关系 %K 搜索行为 %K 马尔可夫随机游走 %K 查询推荐 %K 检索结果聚类 %U http://www.aas.net.cn/CN/abstract/abstract18433.shtml