全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于加权隐含狄利克雷分配模型的新闻话题挖掘方法

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对传统新闻话题挖掘准确率不高、话题可解释性差等问题,结合新闻报道的体例结构特点,提出一种基于加权隐含狄利克雷分配(lda)模型的新闻话题挖掘方法。首先从不同角度改进词汇权重并构造复合权值,扩展lda模型生成特征词的过程,以获取表意性较强的词汇;其次,将类别区分词(cdw)方法应用于建模结果的词序优化上,以消除话题歧义和噪声、提高话题的可解释性;最后,依据模型话题概率分布的数学特性,从文档对话题的贡献度以及话题权值概率角度对话题进行量化计算,以获取热门话题。仿真实验表明:与传统lda模型相比,改进方法的漏报率、误报率分别平均降低1.43%、0.16%,最小标准代价平均降低2.68%,验证了该方法的可行性和有效性。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133