全部 标题 作者 关键词 摘要
Keywords: 概率,tf-idf,网页,文本分类,利用《知网》和领域关键词集扩展方法的短文本分类研究
Full-Text Cite this paper Add to My Lib
?针对tf-idf在待分类文本类的数量分布不均时提取特征值效果差的问题,提出使用特征值在类间出现的概率比代替特征值在类间出现的次数比以改进tf-idf算法。实验证明利用改进后的tf-idf方法提取网页文本特征值,并配合简单累加求和的分类器,使得网页文本分类的准确率有明显提高,且分类速度加快。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133