%0 Journal Article %T 一种融入用户点击模型Word2Vec查询词聚类 %A 杨河彬 %A 杨静 %A 贺樑 %J 中山大学学报(自然科学版) %D 2016 %X 摘要 用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CTWord2Vec神经网络语言模型.CTWord2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CTWord2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升 %K 查询词 %K 聚类 %K Word2Vec %K 点击模型 %K CTWord2Vec %U http://xwxt.sict.ac.cn/CN/abstract/abstract3339.shtml