%0 Journal Article %T 文本分类中tf-idf方法的改进研究 %A 覃世安 %A 李法运 %J 现代图书情报技术 %D 2013 %X ?针对tf-idf在待分类文本类的数量分布不均时提取特征值效果差的问题,提出使用特征值在类间出现的概率比代替特征值在类间出现的次数比以改进tf-idf算法。实验证明利用改进后的tf-idf方法提取网页文本特征值,并配合简单累加求和的分类器,使得网页文本分类的准确率有明显提高,且分类速度加快。 %K 概率 %K tf-idf %K 网页 %K 文本分类 %K 利用《知网》和领域关键词集扩展方法的短文本分类研究 %U http://www.infotech.ac.cn/CN/abstract/abstract3796.shtml