|
环境科学 2008
基于遗传-支持向量机和遗传-径向基神经网络的有机物正辛醇-水分配系数QSPR研究Keywords: 定量结构-性质相关(QSPR) 正辛醇-水分配系数(kow) 遗传算法(GA) 支持向量机(SVM) Abstract: 基于遗传算法(GA)的因子筛选和支持向量机(SVM)的非线性回归,提出了1种改进的有机物定量结构-性质相关(QSPR)建模方法——遗传-支持向量机(GA-SVM),并将其用于38种食品工业常用有机物正辛醇-水分配系数(kow)的QSPR建模.结果显示,QSPR模型选取了分子量、Hansen极性、沸点、含氧率和含氢率5种参数;模型的预测值与实测值间的误差平方和(SSE)、均方差(RMSE)和决定系数(r2)分别为0.048、0.036和0.999,表明模型具有较强的预测能力;同时,交叉验证的结果(SSE=0.295,RMSE=0.089,R2=0.995)也表明,模型具有良好的稳健性,因此,GA-SVM算法适用于对有机物正辛醇-水分配系数的QSPR建模.此外,将基于GA-SVM的QSPR模型分别与基于遗传-径向基神经网络(GA-RBFNN)和基于线性算法的模型进行了比较,结果表明,应用GA-SVM建立的QSPR模型无论从稳健性还是预测能力上都优于应用其它2种算法建立的模型,因此,GA-SVM算法比GA-RBFNN和线性算法更适合于对有机物正辛醇-水分配系数进行QSPR建模
|