|
计算机科学 2002
The Research of Internet Information Integration
|
Abstract:
1 引言当今,世界已经进入网络时代,很多信息都可以从互联网上获取。但是,网络中的信息杂乱繁多,存在几个缺点:一是很多信息只有字面上的差异,实际上是相同的;二是很多数据具有关联性,应该组合起来提供更完整的信息;三是很多信息都是残缺的,而且可能引起矛盾。针对这个情况,我们有必要进行网络信息集成,让互联网为我们提供更加准确和完备的信息。信息集成从字面上理解,只是指对信息进行句法或语义层次上的处理。而实际上,在互联网环境中,信息集成具有更加丰富的内涵。首先是信息的获取。目前,人们从网络中获取信息一般都通过搜索引擎。几乎所有的搜索引擎都是关键字