|
生物工程学报 2009
基于二级结构氨基酸组成识别酸性、中性及碱性酶, PP. 1508-1515 Keywords: 二级结构,氨基酸组成,酸性酶,碱性酶,稳定性机制,特征提取,随机森林 Abstract: 本研究系统分析了酸性、碱性和中性酶在二级结构氨基酸组成上的差异。结果发现在形成特定二级结构过程中,酸性酶和碱性酶有着不同的氨基酸使用偏向;同时,在酸性和碱性酶中,中性氨基酸和侧链微小的氨基酸含量明显较高,这可能是它们适应极端ph的普遍机制。基于此,提出了一种提取蛋白质序列特征值的新方法,其10倍交叉验证的精度可达80.3%。与其他常见特征值提取方法相比,其精度提高了9.4%到18.7%不等;而随机森林算法比其他机器学习算法识别精度也高出2.7%到21.8%不等。
|