|
物理化学学报 2011
基于机器学习方法的丙型肝炎病毒非结构蛋白5b聚合酶抑制剂活性预测Keywords: 机器学习方法,分子描述符,递归变量消除法,支持向量机,丙型肝炎病毒 Abstract: 在丙型肝炎病毒(hcv)的基因复制和蛋白质成熟的过程中,非结构蛋白5b(ns5b)作为rna依赖的rna聚合酶起到了重要的作用.抑制ns5b聚合酶可以阻止丙型肝炎病毒的rna复制,因此成为一种治疗丙型肝炎的有效方法.通过计算机方法进行虚拟筛选和预测ns5b聚合酶抑制剂已经变得越来越重要.本文主要采用机器学习方法(支持向量机(svm)、k-最近相邻法(k-nn)和c4.5决策树(c4.5dt))对已知的丙型肝炎病毒ns5b蛋白酶抑制剂与非抑制剂建立分类预测模型.1248个结构多样性化合物(552个ns5b抑制剂与696个非ns5b抑制剂)被用于测试分类预测系统,并用递归变量消除法选择与ns5b抑制剂相关的性质描述符以提高预测精度.独立验证集的总预测精度为84.1%-85.0%,ns5b抑制剂的预测精度为81.4%-91.7%,非ns5b抑制剂的预测精度为78.2%-87.2%.其中支持向量机给出最好的ns5b抑制剂预测精度(91.7%);c4.5决策树给出最好的非ns5b抑制剂预测精度(87.2%);k-最近相邻法给出最好的总预测精度(85.0%).研究表明机器学习方法可以有效预测未知数据集中潜在的ns5b抑制剂,并有助于发现与其相关的分子描述符.
|