%0 Journal Article
%T Two Effective Functions on Hashing URL in Collecting Chinese Information
两种适用于中文信息搜集的URL散列函数的研究
%A Li CunGe
%A He ShuQing
%A Zhang PeiYing
%A
李村合
%A 何淑庆
%A 张培颖
%J 计算机系统应用
%D 2006
%I
%X 为了适应Internet信息量的快速增长,搜索引擎采用分布式技术搜集信息。采用分布式搜集技术的具体应用中主要存在两个关键问题:URL匹配和系统负载平衡。针对现有的几种分布式信息搜集系统的设计中存在的一些不足,提出了利用URL分级散列进行定位和匹配的方法。根据中文网络信息的特点,分析了几个对字符串散列较好的函数,设计了两种URL散列函数,应用于分布式中文信息搜集系统中。实验表明,系统在减少URL匹配的资源消耗和提高系统负载的均衡性方面有很好的效果。
%K 散列函数
%K 分布式
%K 搜索引擎
%K 匹配
%K 负载平衡
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=D4F6864C950C88FFCE5B6C948A639E39&aid=D71B87CCF7CF2A4F&yid=37904DC365DD7266&iid=DF92D298D3FF1E6E&sid=ECE8E54D6034F642&eid=1AE5323881A5ECDC&journal_id=1003-3254&journal_name=计算机系统应用&referenced_num=0&reference_num=6