全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2002 

基于关联规则的web文档聚类算法

, PP. 417-423

Keywords: 文档聚类,关联规则,web挖掘,www

Full-Text   Cite this paper   Add to My Lib

Abstract:

web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种web文档的聚类算法.该算法首先采用向量空间模型vsm(vectorspacemodel)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133