|
- 2018
基于文本属性的微博用户相似度研究DOI: 10.3969/j.issn.1673-629X.2018.05.005 Keywords: 微博, 社交网络, 用户相似度, 文本相似度, 余弦相似度, 层次分析法 Abstract: 传统的相似度计算方法忽略了用户主观输出的微博文本信息,而这正是体现用户兴趣点的重要元素,只有结合了用户自身信息及其在社交平台上的互动内容,才能相对全面描述一个用户,由此提出基于文本属性的相似用户计算方法。把相似度主要划分为背景相似、兴趣相似两个角度,其中兴趣相似度主要由文本相似度决定,分词并采用 TF-IDF 变换后进行余弦相似度计算;再结合用户所在地、使用设备、发微博的时间、转发关系以及好友关系来描述用户相似度;并利用层次分析法分配各个属性的权重,构建相似度计算模型。通过实验系统性对比了基于文本属性的计算方法与改进前的算法:改进算法得出的用户相似度的 F 1 度量值提高了 34.3%,证明了该算法的优越性
|