%0 Journal Article %T 基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用 %J 系统工程理论与实践 %P 815-825 %D 2012 %X ?随机森林被广泛应用于包括癌症诊断在内的生物信息学领域.从自适应k近邻的角度分析了随机森林的分类机理,分析其存在的信息损失,据此提出一种新的投票机制,称为基于随机森林的潜在k近邻算法rf-pn,能够充分利用决策树上的oob样本信息,显著改善随机森林的分类性能.6个癌症基因表达数据集上的对比实验表明,rf-pn的分类准确率优于原算法. %K 随机森林 %K 潜在k近邻 %K 基因表达数据 %U http://www.sysengi.com/CN/abstract/abstract109718.shtml