|
中山大学学报(自然科学版) 2018
采用可变时间窗口的TIF-LDA微博主题模型Keywords: 短文本,主题挖掘,可变时间窗口,时间影响因子,LDA Abstract: 摘要 微博是社交网络的主要形式,其短文本和时效性的特点能够体现出当前大众最新兴趣取向.微博文本不同于传统文本,其时效性的特点使得在对其进行主题挖掘时容易忽略时间因素而造成结果不准确.针对此问题,提出了采用可变时间窗口的TIF-LDA微博主题模型对微博主题分析做出时间限定,并基于微博发布的时间为微博词条添加时间权重,使用词条的时间权重之和作为词条在LDA主题挖掘计算中的影响因子.实验结果表明,相较于标准的LDA主题模型,本文所提模型能够更加准确地反映用户最新的关注热点
|