%0 Journal Article %T 列名与数值不确定情况下的模式匹配问题研究 %A 黄冬梅? %A 冯恺? %A 赵丹枫? %A 郭颖新? %J 计算机科学 %D 2014 %R 10.11896/j.issn.1002-137X.2014.08.018 %X 模式匹配是数据集成领域的一个重要研究内容,列名与数据值不确定是模式匹配中的一种常见情况,当前较普遍的方法是基于互信息及欧式空间距离。但该方法没有解决因属性相似度相同或相近而引起的错误匹配问题。针对该问题,提出了多重迭代筛选方法,首先确定两个关系模式中能一次性正确匹配的部分属性对,再从中求出最优属性对,然后给出基于条件互信息的匹配方法,利用最优属性对计算未匹配属性的条件互信息,进一步计算各属性之间的欧氏距离,最终得到匹配结果,从而解决了错误匹配问题。实验结果表明所提算法正确、有效。 %K 不确定性 %K 模式匹配 %K 条件互信息 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=20140818&flag=1