%0 Journal Article %T 网页pagelet的自动抽取方法 %A 朱明 %A 李伟 %J 计算机应用 %D 2005 %X ?web页面中除了所包含的数据外,往往还包含很多导航信息、广告等。针对web页面的特点,提出了dom树比较算法,通过对多个页面进行比较,识别出主体内容。实验结果证明该方法是有效可行的。 %K web挖掘 %K 信息获取 %K dom相似度 %K dom节点聚类 %U http://www.joca.cn/CN/abstract/abstract9392.shtml