全部 标题 作者 关键词 摘要
Keywords: 短文本,分类,k近邻,相似度,隐含狄列克雷分配
Full-Text Cite this paper Add to My Lib
?针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下文,降低权重;另一方面关联不同词以减少稀疏性,增加权重。采用k近邻方法对自动抓取的网易页面标题数据进行分类,实验表明新方法在分类性能上比传统的向量空间模型和基于主题的相似性度量分别高5%和2.5%左右。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133