%0 Journal Article %T 面向文本分类的混淆类判别技术 %A 朱靖波? %A 王会珍? %A 张希娟? %J 软件学报 %P 630-639 %D 2008 %X 分析了文本分类过程中存在的混淆类现象,主要研究混淆类的判别技术,进而改善文本分类的性能.首先,提出了一种基于分类错误分布的混淆类识别技术,识别预定义类别中的混淆类集合.为了有效判别混淆类,提出了一种基于判别能力的特征选取技术,通过评价某一特征对类别之间的判别能力实现特征选取.最后,通过基于两阶段的分类器设计框架,将初始分类器和混淆类分类器进行集成,组合了两个阶段的分类结果作为最后输出.混淆类分类器的激活条件是:当测试文本被初始分类器标注为混淆类类别时,即采用混淆类分类器进行重新判别.在比较实验中采用了newsgroup和863中文评测语料,针对单标签、多类分类器.实验结果显示,该技术有效地改善了分类性能. %K 文本分类 %K 混淆类判别 %K 特征选取 %K 分类错误分布 %K 机器学习 %K 自然语言处理 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=20080314&flag=1