全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于lda主题模型的短文本分类方法

Keywords: 短文本,分类,k近邻,相似度,隐含狄列克雷分配

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下文,降低权重;另一方面关联不同词以减少稀疏性,增加权重。采用k近邻方法对自动抓取的网易页面标题数据进行分类,实验表明新方法在分类性能上比传统的向量空间模型和基于主题的相似性度量分别高5%和2.5%左右。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133