%0 Journal Article %T 链路结构的网页聚类研究 %A 刘勘 %A 范琴 %J 中山大学学报(自然科学版) %D 2016 %X 摘要 网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节点的基本集、扩展集、半径、邻域、密度和路径树等概念;然后,利用共享入度出度以及网页之间的相异度来衡量其距离,并结合扩展集中的链接信息设计了网页相似度的计算模型;最后,利用密度分布对网页进行聚类.实验结果表明,本算法具有较好的聚类效果 %K Web挖掘 %K 链接分析 %K 网页聚类 %U http://xwxt.sict.ac.cn/CN/abstract/abstract3486.shtml