OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

软件学报 2002

用boosting方法组合增强stumps进行文本分类

, PP. 1361-1367

刁力力？,胡可云？,陆玉昌？,石纯一？

Keywords: 文本分类,机器学习,stump,boosting

Full-Text Cite this paper Add to My Lib

Abstract:

为提高文本分类的精度,schapire和singer尝试了一个用boosting来组合仅有一个划分的简单决策树(stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以vsm表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度,在类代表向量的计算过程中动态引入boosting分配给各学习样本的权重.实验结果表明,这种方法提高了用boosting组合stump分类器进行文本分类的性能(精度和效率),而且问题规模越大,效果越明显.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133