|
软件学报 2013
web数据源选择技术DOI: 10.3724/SP.J.1001.2013.04374, PP. 781-797 Keywords: 数据集成,web,数据源,文本,结构化与半结构化,源摘要 Abstract: 在web数据集成的过程中,如何从大量的web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为web数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍web数据源选择的研究沿革及现状,并对web数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了web数据源选择未来的研究方向.
|