%0 Journal Article %T 基于文本属性的微博用户相似度研究 %J - %D 2018 %R 10.3969/j.issn.1673-629X.2018.05.005 %X 传统的相似度计算方法忽略了用户主观输出的微博文本信息,而这正是体现用户兴趣点的重要元素,只有结合了用户自身信息及其在社交平台上的互动内容,才能相对全面描述一个用户,由此提出基于文本属性的相似用户计算方法。把相似度主要划分为背景相似、兴趣相似两个角度,其中兴趣相似度主要由文本相似度决定,分词并采用 TF-IDF 变换后进行余弦相似度计算;再结合用户所在地、使用设备、发微博的时间、转发关系以及好友关系来描述用户相似度;并利用层次分析法分配各个属性的权重,构建相似度计算模型。通过实验系统性对比了基于文本属性的计算方法与改进前的算法:改进算法得出的用户相似度的 F 1 度量值提高了 34.3%,证明了该算法的优越性 %K 微博 %K 社交网络 %K 用户相似度 %K 文本相似度 %K 余弦相似度 %K 层次分析法 %U http://www.xactad.org//oa/darticle.aspx?type=view&id=201805005