全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

一种基于类别分布信息的文本特征选择模型

Keywords: 文本分类,特征选择,tf-idf,类内分布,类间分布

Full-Text   Cite this paper   Add to My Lib

Abstract:

?tf-idf是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的tf及idf部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得tf部分含有类内文本频数信息,同时idf部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,f1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133