%0 Journal Article %T 网络热点新闻焦点识别与演化跟踪 %A 刘玉文 %A 吴宣够 %A 郭强 %J 中山大学学报(自然科学版) %D 2017 %X 摘要 网络新闻焦点识别及演化跟踪对新闻检索、新闻推荐和舆情分析等起着非常重要的作用.当前的新闻焦点识别方法存在着焦点识别不清、演化跟踪偏斜以及不能捕获焦点报道的强度分布等问题.通过深入分析新闻报道的特点及LDA(Latent Dirichlet Allocation)主题模型原理,把报道文档发布的时间信息引入LDA模型中,提出一种基于焦点和时间联合建模的新闻焦点演化跟踪方法DSTLDA (Dynamic Subtopic and Time based Topic Model).该模型避免了以往跟踪算法严重依赖时间分割的局限性,能够产生文档焦点θ、焦点词汇φ及焦点时间π三个分布矩阵,通过选择新闻焦点的特征词和特征时间,高效地分类出新闻焦点并识别出各焦点持续的时间分布及报道力度.本文在4个新闻数据集上分别对DSTLDA算法进行了实验验证,并与其它主流算法进行了对比.实验证明:本文算法在新闻焦点演化跟踪方面达到了良好效果 %K 新闻焦点 %K LDA %K 新闻演化 %K 焦点识别 %K DSTLDA %K 焦点跟踪 %U http://xwxt.sict.ac.cn/CN/abstract/abstract3876.shtml