%0 Journal Article %T A Comparison Study of Missing Value Processing Methods
缺失数据处理方法的比较研究 %A 刘鹏 %A 雷蕾 %A 张雪凤 %J 计算机科学 %D 2004 %I %X 数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯补缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。 %K 信息增益 %K 朴素贝叶斯分类器 %K 模型 %K 数据挖掘 %K 决策树 %K 数据集 %K 医疗领域 %K 医疗数据 %K 保留 %K 处理 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=15F7034DD6AEC744&yid=D0E58B75BFD8E51C&vid=4AD960B5AD2D111A&iid=F3090AE9B60B7ED1&sid=7CE3F1F20DE6B307&eid=3F0AF5EDBC960DB0&journal_id=1002-137X&journal_name=计算机科学&referenced_num=6&reference_num=6