|
中山大学学报(自然科学版) 2018
语义约束和时间关联LDA的社交媒体主题词链提取Keywords: 社交媒体,主题模型,语义约束,LDA模型,时间关联 Abstract: 摘要 网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率
|