|
中山大学学报(自然科学版) 2019
DR-RDC:基于校准否定约束集的数据修复方法Keywords: 数据修复,数据不一致,否定约束,关联矩阵,证据规则 Abstract: 摘要 数据不一致是关系数据库中普遍存在的问题,利用约束规则进行数据修复是解决该问题的有效方法.现有修复方法主要利用函数依赖和条件函数依赖,所考虑的约束规则不能包含大于或小于的语义约束,且忽视了约束规则之间可能存在的冲突及其对数据集的符合程度.本文考虑否定约束,提出了基于校准否定约束集的数据修复方法(DR-RDC),首先利用符合度记分函数计算出每个否定约束对数据集的符合度分数,并排序,剔除小于阈值的否定约束,再使用关联矩阵对否定约束进行冲突消除,得出校准否定约束集,将其作用于原始数据集,检测出冲突元组对的否定约束放入证据规则集,冲突元组对放入冲突元组集.根据证据规则的符合度分数由高到低地选取证据规则对数据集进行修复,将条件概率最大的属性值作为冲突属性的修复值,直到冲突元组集不违反任一否定约束.实验验证了DR-RDC所获得的精确度优于数据语义置信度方法,DR-RDC比使用原始否定约束集在数据修复方面有显著改善
|