%0 Journal Article %T 基于提取网站层次结构的网页分类方法 %A 邓健爽 %A 郑启伦 %A 彭宏 %J 计算机应用 %D 2006 %X ?网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容的分类和基于网页间超链接结构的分类。但是这些分类都只利用了网页的信息,没有考虑到网页所在网站提供的信息。文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到电子商务智能搜索和挖掘系统中。 %K 网页分类 %K 网站层次结构 %K url聚类 %U http://www.joca.cn/CN/abstract/abstract9978.shtml