%0 Journal Article %T 基于概念的网页相似度处理算法研究 %A 郭晨娟 %A 李战怀 %J 计算机应用 %D 2006 %X ?针对海量网页信息,提出适于搜索引擎使用的网页相似度处理算法。算法依据网页抽象形成的概念,在倒排文档基础上建立相似度处理模型。该模型缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为优化相似度计算奠定了良好基础。 %K 相似网页 %K 概念抽取 %K 聚类分析 %K 消重 %U http://www.joca.cn/CN/abstract/abstract8663.shtml