|
- 2016
一种融入用户点击模型Word2Vec查询词聚类Keywords: 查询词,聚类,Word2Vec,点击模型,CTWord2Vec Abstract: 摘要 用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CTWord2Vec神经网络语言模型.CTWord2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CTWord2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升
|