|
计算机科学 2014
adst:用机器学习方法鉴别结节病和肺结核Keywords: 结节病,肺结核,dct,nb,svm中图法分类号tp181文献标识码a Abstract: 结节病和肺结核的临床鉴别诊断目前仍然是困难的。搜集了106例结节病和肺结核的对比资料,并筛选出对分类有意义的临床指标作为特征,将其进行必要的量化和缩放形成训练数据,然后分别用支持向量机(svm:supportvectormachine)、决策分类树(dct:decisionclassificationtree)、朴素贝叶斯(nb:navebayes)3种不同的方法进行训练,并用5倍交叉验证评估各种不同的模型的有效性。实验结果表明,这3种方法在识别结节病时对应的roc曲线下的面积分别为0.978,0.96,0.690,得到的测试精度分别达到100%,96.15%,96.15%,训练精度分别为95.28%,90.57%,92.38%。用这3种方法得到的分类器对19例临床未能确诊的病患进行预测,dct方法的预测结果与svm方法的结果高度吻合(19例中仅1例预测结果不同),而nb方法预测结果稍差(19例中有3例与svm预测结果不一致)。实验结果表明,3种方法中,svm方法的分类能力和分类精度最高。临床实验结果表明,19例临床未能确诊的病患按照svm算法预测的结果进行治疗均得到了康复。
|