%0 Journal Article %T 一种改进的ML-kNN多标记文档分类方法 %A 程圣军 %A 黄庆成 %A 刘家锋 %A 唐降龙 %J 哈尔滨工业大学学报 %P 45-49 %D 2013 %R 10.11918/j.issn.0367-6234.2013.11.008 %X 针对应用传统k近邻算法进行多标记文档分类时忽略了标记之间相关性的问题,提出了一种改进的ML-kNN多标记文档分类方法.针对文本特征的特点,采用一种基于KL散度的距离尺度来更好地描述文档相似度.根据近邻样本所属类别的统计信息,通过一种模糊最大化后验概率法则来推理未标记文档的标记集合.与ML-kNN不同的是,该方法可以有效地利用标记相关性来提升分类性能.在3个标准数据集上,5个多标记学习常用评测指标下的实验结果表明:所提方法在多标记文档分类问题上要明显优于ML-kNN、Rank-SVM和BoosTexter等主流多标记学习算法. %K 文档分类 %K 多标记学习 %K 标记相关性 %K k近邻 %K KL散度 %U http://journal.hit.edu.cn/hitxb_cn/ch/reader/view_abstract.aspx?file_no=20131108&flag=1