|
计算机科学 2014
基于web的实例扩展与属性值扩充方法Abstract: 实例扩展与属性值扩充是web抽取与集成领域中的一个重要研究课题,将web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩展实例的属性信息,对结构化数值属性或离散属性进行抽取,提出了基于整数线性规划的属性值扩充方法。实验表明,与以前的方法相比,本方法能更好地处理含有噪声数据的web网页,并提高了抽取的准确率和召回率。
|