全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
-  2016 

面向中文新闻话题检测的多向量文本聚类方法 A Multi-vector Text Clustering Method for Chinese News Topic Detection

Keywords: 话题检测,多向量模型,TDT4,改进TFIDF算法

Full-Text   Cite this paper   Add to My Lib

Abstract:

基于多向量模型,给出一种将话题主题信息与话题文本信息相结合的多向量话题表示方式,使用较低的维度来准确表示一个话题.针对传统TFIDF方法在文本分类问题中对特征项在各个类中分布情况考虑不充分的问题,给出了一种TFIDF改进方法.在TDT4的中文语料上,与传统向量空间模型进行了对比实验.实验结果表明,给出的话题表示方法和TFIDF改进算法能够在较低的维度上,使聚类的准确率得到较大提升.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133