全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

融合网格密度的聚类中心初始化方案

DOI: 10.13190/jbupt.200702.6.108, PP. 6-10

Keywords: 密度指针,聚集因子,聚类中心,初始化

Full-Text   Cite this paper   Add to My Lib

Abstract:

提出了一种采用密度指针的聚类中心初始化方法——densitypointer(DP)算法。DP算法以网格单元的几何中心为对称中心,连接该中心与网格单元各顶点,以此对称分割传统的类矩形网格单元,形成超三角形子空间;进而根据各个超三角形子空间与邻居单元相邻的超三角形子空间的密度差异确定密度指针的方向,并根据密度指针计算出每个密集网格单元的聚集因子;最后将具有较大局部聚集因子的网格单元族的重心作为初始聚类中心。在公开数据集和人工数据集上的实验结果表明,DP算法能快速高效地找到接近于真实聚类中心的数据点作为初始聚类中心。针对算法的效率实验表明,DP算法的时间开销与数据集实例数、维度及网格单元数量均呈一阶线性关系。

References

[1]  Han J W, Kamber M. Data mining concepts and techniques[M]. Singapore: Elesvier Inc, 2006: 402-404.
[2]  Ye Yunming, Huang Zhexue, Chen Xiaojun, et al. Neighborhood density method for selecting initial cluster centers in K-means clustering//Proceedings of PAKDD ’06: Advances in Knowledge Discovery and Data Mining, 10th Pacific-Asia Conference. Singapore: Springer, 2006: 189-198.
[3]  He Ji, Lan M, Tan C L, et al. Initialization of cluster refinement algorithms: a review and comparative study//Proceedings of International Joint Conference on Neural Networks. Budapest:, 2004: 297-302.
[4]  Kaufman L. Finding groups in data: an introduction to cluster analysis[M]. New York: Wiley, 1990: 64-75.
[5]  Katsavounidis I, Kuo C, Zhang Zhen. A new initialization technique for generalized lloyd iteration[J]. IEEE Signal Processing Letters, 1994, 1(10): 144-146.
[6]  赵艳厂, 宋梅, 谢帆, 等. 用于不同密度聚类的多阶段等密度线算法[J]. 北京邮电大学学报, 2003, 26(2): 42-47. Zhao Yanchang, Song Mei, Xie Fan, et al. Clustering datasets containing clusters of various densities[J]. Journal of Beijing University of Posts and Telecommunications, 2003, 26(2): 42-47.
[7]  He Ji. He Ji's Weblog . .
[8]  Wan Yan, Si Yaqing. Knowledge discovery and its applications in telecommunications industry[J]. The Journal of China Universities of Posts and Telecommunications, 1999, 6(1): 46-51.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133