%0 Journal Article %T 基于样本条件价值改进的Co-training算法 %A 程圣军 %A 刘家锋 %A 黄庆成 %A 唐降龙 %J 自动化学报 %P 1665-1673 %D 2013 %R 10.3724/SP.J.1004.2013.01665 %X ?Co-training是一种主流的半监督学习算法.该算法中两视图下的分类器通过迭代的方式,互为对方从无标记样本集中挑选新增样本,以更新对方训练集.Co-training以分类器的后验概率输出作为新增样本的挑选策略,该策略忽略了样本对于当前分类器的价值.针对该问题,本文提出一种改进的Co-training式算法—CVCOT(Conditionalvalue-basedco-training),即采用基于样本条件价值的挑选策略来优化Co-training.通过定义无标记样本的条件价值,各视图下的分类器以样本条件价值为依据来挑选新增样本,以此更新训练集.该策略既可保证新增样本的标记可靠性,又能优先将价值较高的富信息样本补充到训练集中,可以有效地优化分类器.在UCI数据集和网页分类应用上的实验结果表明:CVCOT具有较好的分类性能和学习效率. %K 机器学习 %K 半监督学习 %K Co-training %K 富信息样本 %K 条件价值 %U http://www.aas.net.cn/CN/abstract/abstract18203.shtml