|
大连理工大学学报 2012
PCA方法在蛋白质亚细胞定位中应用DOI: 10.7511/dllgxb201203019, PP. 426-430 Keywords: 蛋白质亚细胞定位,主成分分析,伪氨基酸组成,k近邻分类器,BP神经网络 Abstract: 蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映序列次序效应的最优λ值.首先让λ取最大以包含尽可能多的序列次序信息,然后利用主成分分析法提取关键主特征.实验结果表明此方法能解决确定最优λ值困难的问题,且性能优于已有的预测工具.
|