全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于量值的频繁闭项集层次聚类算法

DOI: 10.13190/jbupt.201106.64.yanh, PP. 64-68

Full-Text   Cite this paper   Add to My Lib

Abstract:

提出了基于量值的频繁闭项集层次聚类算法CFIHCQ,并将其应用于Web使用挖掘。该算法首先通过用户Web访问数据获取频繁闭项集;其次,以频繁闭项集对簇进行初始化,并以打分的方式将用户指入唯一簇;再次按照簇标记生成自上而下的簇树结构,并使用用户访问向量分裂子簇;最后,对簇树进行剪枝。实验表明,该算法能够很好的预测用户Web访问行为;在海量用户数据情况下,可满足实时挖掘的需求;并能以树结构展示挖掘结果。

References

[1]  Abraham A. i-Miner: a web usage mining framework using hierarchical intelligent system//The 12th IEEE International Conference on Fuzzy System.St.Louis, Missouri: IEEE, 2003: 1129-1134.
[2]  窦伊男. 根据多维特征的网络用户分类研究. 北京: 北京邮电大学图书馆, 2010: 125-128.
[3]  Chu-Hui Lee, Yu-Hsiang Fu. Web usage mining based on clustering of browsing features//ISDA 2008. Kaohsiung: IEEE, 2008: 281-286.
[4]  Fung Benjamin C M, Wang Ke, Ester Martin. Hierarchical document clustering using frequent itemsets//SDM 2003. San Francisco: SIAM, 2003: 59-70.
[5]  Rui Xu, Donald Wunsch II. Survey of clustering algorithms[J]. IEEE Transactions on Neural Networks, 2005, 16: 4-37.
[6]  Sharma A, Dhir R. A wordsets based document clustering algorithm for large datasets//ICM2CS 2009. Delhi: IEEE, 2009: 1-7.
[7]  Nicolas Pasquier, Yves Bastide, Rafik Taouil, et al. Discovering frequent closed itemsets for association rules//ICDT 1999. Jerusalem: ACM, 1999: 398-416.
[8]  Agrawal R, Srikant R. Fast algorithm for mining association rules//VLDB 1994. Santiago: , 1994: 487-499.
[9]  李金宗. 模式识别导论[M]. 北京: 高等教育出版社, 1994: 318-321. 更正本刊2011年第5期63页"基于判决域半径的码字错误率估计"一文中第2作者杨鸿文的单位应为"北京邮电大学信息与通信工程学院",特此更正.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133