%0 Journal Article %T 基于分布和逆文本类别指数的特征迁移加权算法 %A 邱云飞 %A 刘世兴 %A 林明明 %A 邵良杉 %J 计算机应用 %D 2015 %X ?传统机器学习面临一个难题,即当训练数据与测试数据不再服从相同分布时,由训练集得到的分类器无法对测试集文本准确分类。针对该问题,根据迁移学习原理,在源领域和目标领域的交集特征中,依据改进的特征分布相似度进行特征加权;在非交集特征中,引入语义近似度和新提出的逆文本类别指数(tf-icf),对特征在源领域内进行加权计算,充分利用大量已标记的源领域数据和少量已标记的目标领域数据获得所需特征,以便快速构建分类器。在文本数据集20newsgroups和非文本数据集uci中的实验结果表明,基于分布和逆文本类别指数的特征迁移加权算法能够在保证精度的前提下对特征快速迁移并加权。 %K 迁移学习 %K 特征分布 %K 逆文本类别指数 %K 语义近似度 %K 特征加权 %U http://www.joca.cn/CN/abstract/abstract18245.shtml