%0 Journal Article %T 基于三类特征融合的O-糖基化位点预测 %A 向妍 %A 袁哲明 %A 谭泗桥 %A 陈渊 %J 生物化学与生物物理进展 %D 2016 %X 糖基化是蛋白质翻译后的主要修饰,O-糖基化的固定模式未知,高精度识别O-糖基化位点是机器学习面临的挑战性问题.以迄今最大的人O-糖基化位点Steentoft数据集为基础,本文首次提出了基于位置的卡方差表特征χ2-pos,融合伪氨基酸序列进化信息PsePSSM 以及无方向的k间隔氨基酸对组分Undirected-CKSAAP表征序列,构建5个正负样本均衡的支持向量机分类器,经加权投票,独立测试准确率、Matthew相关系数及ROC曲线下面积,分别达到了89.62%、0.79、0.96,明显优于文献报道结果.χ2-pos、PsePSSM与Undirected-CKSAAP三种特征的融合在蛋白质糖基化、磷酸化等位点预测中有广泛应用前景 %K O-糖基化位点预测 %K 卡方差表特征 %K 伪氨基酸序列进化信息 %K 无方向的k间隔氨基酸对组分 %K 加权投票 %U http://www.pibb.ac.cn/pibbcn/ch/reader/view_abstract.aspx?file_no=20160002&flag=1