|
物理化学学报 2013
基于机器学习方法的h1n1神经氨酸苷酶抑制剂的分类预测Keywords: 机器学习方法,h1n1型流感病毒,神经酰胺酶抑制剂,支持向量机 Abstract: 流感是一种主要的呼吸道传染病,在普通人群中有着较高的发病率,而对于一些年老和高危病人还有较高的死亡率.研究显示抑制神经氨酸苷酶(na)可以阻断病毒rna复制,因此na是有效治疗h1n1型流感病毒的重要药物靶标.通过计算机方法进行虚拟筛选和预测na抑制剂已经变得越来越重要.针对酶活性位点进行基于结构的合理药物设计,开发h1n1病毒神经氨酸苷酶抑制剂,已成为药物研究的热点之一.本文通过多种机器学习方法(支持向量机(svm)、k-最近相邻法(k-nn)和c4.5决策树(c4.5dt))对已知的神经氨酸苷酶抑制剂(nais)与非神经氨酸苷酶抑制剂(non-nais)建立分类预测模型.其中227个结构多样性化合物(72个nais与155个non-nais)被用于测试分类预测系统,并用递归变量消除法选择与神经氨酸苷酶抑制剂分类相关的性质描述符以提高预测精度.本研究对独立验证集的总预测精度为75.9%-92.6%,na抑制剂的预测精度为64.3%-78.6%,非h1n1抑制剂的预测精度为77.5%-97.5%.svm法给出最好的总预测精度(92.6%).本研究表明支持向量机等机器学习方法可以有效预测未知数据集中潜在的na抑制剂,并有助于发现与其相关的分子描述符.
|