%0 Journal Article %T Research on Web Document Cleaning
Web文档清洗技术 %A 张波 %A 王继成 %A 王强 %A 张福炎 %J 计算机科学 %D 2002 %I %X 1 引言随着Internet在全球的迅速发展,WWW(World WideWeb)已经发展成为一个包含多种信息资源、站点遍布全球的巨大信息服务网络,为用户提供了一个极具价值的信息源,并已成为世界范围内信息共享和信息传播的最主要渠道之一。WWW系统一经出现,就得到了迅猛的发展,无论是WWW站点数还是WWW用户数,都是以每年5~10倍的速度呈指数形式增长。目前仅中国的Internet用户就已经达到了2500万。但是随着网络上信息资源的迅速膨胀,WWW的开放性、 %K Web %K Internet %K WWW %K 信息资源 %K 信息挖掘 %K 文档清洗 %K 计算机网络 %K 信息检索 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=3DB0C9E8DDA48571&yid=C3ACC247184A22C1&vid=771469D9D58C34FF&iid=B31275AF3241DB2D&sid=286FB2D22CF8D013&eid=318E4CC20AED4940&journal_id=1002-137X&journal_name=计算机科学&referenced_num=4&reference_num=5