|
软件学报 2009
基于代价模型的不一致xml数据修复启发式计算, PP. 918-929 Keywords: 不一致性,不一致数据,修复,一致的查询回答,xml,数据清洗,不完整数据库 Abstract: 在实际应用中,为不一致的xml文档计算最优修复意义重大.但求解最优修复是一个np完全问题,特别是在xml文档同时违反函数依赖约束和主键约束时.提出一个基于代价模型的、可以在多项式时间内完成的启发式修复求解算法.该算法首先借助索引表,在一遍扫描原始xml文档的情况下寻找不一致数据集,然后为每一类约束的不一致数据集构造候选修复,同时计算其修复代价,最后启发式地求解一个代价最小的修复方案.实验结果表明,该算法的时间复杂度不超过冲突类的3次方,即便是在不一致数据量很大、噪声比例很大以及涉及多类语义约束时,也能较快地完成修复.
|