%0 Journal Article %T 集成改进KNN算法预测蛋白质亚细胞定位 %A 杨荣丽 %A 洪晓宇 %A 王雄飞 %A 薛卫 %A 赵南 %J 生物工程学报 %D 2017 %R 10.13345/j.cjb.160389 %X 基于Adaboost算法对多个相似性比对K最近邻 (K-nearest neighbor,KNN) 分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法 %K 亚细胞区间 %K 蛋白序列特征 %K K-nearest neighbor %K basic local alignment search tool %K Adaboost %U http://journals.im.ac.cn/cjbcn/ch/reader/view_abstract.aspx?file_no=gc17040683&flag=1