%0 Journal Article %T 基于用户行为特征的多维度文本聚类 %A 丁志远 %A 徐立洋 %A 陈艳平 %A 黄瑞章 %J 计算机应用 %D 2018 %R 10.11772/j.issn.1001-9081.2018041357 %X 摘要 传统多维度文本聚类一般是从文本内容中提取特征,而很少考虑数据中用户与文本的交互信息(如:点赞、转发、评论、关注、引用等行为信息),且传统的多维度文本聚类主要是将多个空间维度线性结合,没能深入考虑每个维度中属性间的关系。为有效利用与文本相关的用户行为信息,提出一种结合用户行为信息的多维度文本聚类模型(MTCUBC)。根据文本间的相似性在不同空间上应该保持一致的原则,该模型将用户行为信息作为文本内容聚类的约束来调节相似度,然后结合度量学习方法来改善文本间的距离,从而提高聚类效果。通过实验表明,与线性结合的多维度聚类相比,MTCUBC模型在高维稀疏数据中表现出明显的优势 %K 多维度聚类 %K 度量学习 %K 约束 %K 用户行为特征 %U http://www.joca.cn/CN/abstract/abstract22615.shtml