%0 Journal Article %T 基于特征的数据规格化方法* %A 韩京宇 %A 杨科华 %A 董逸生 %J 计算机应用研究 %D 2008 %I %X 针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题。在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力。这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统计模型和规则模型的优点。理论分析和实验表明,该方法可以有效地实现数据清洗时的数据规格化。 %K 数据清洗 %K 最大熵 %K 马尔可夫模型 %K 重叠特征 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=381BD7EA93E45A60A2935A5E06582D9A&yid=67289AFF6305E306&vid=C5154311167311FE&iid=9CF7A0430CBB2DFD&sid=C54FD882220E5646&eid=40E8FEA07A3DBDC3&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=11