|
物理化学学报 2010
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型Keywords: 乙酰胆碱酯酶抑制剂,机器学习方法,变量筛选,应用域 Abstract: 我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特征的1559个描述符,通过fischerscore排序过滤和montecarlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(svm)、人工神经网络(ann)和k?近邻(k?nn)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%-92.7%,67.0%-81.0%和79.4%-88.2%;通过y?scrambling方法验证svm模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72.7%-82.5%,41.0%-53.0%和62.1%-69.1%,明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本,各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%-100.0%,74.6%-89.6%和86.1%-95.9%.所建模型中,svm模型预测精度最好,且明显高于其它文献报道结果.
|