全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2015 

大数据的密度统计合并算法

DOI: 10.13328/j.cnki.jos.004902, PP. 2820-2835

Keywords: 聚类,抽样,代表点,密度,大数据

Full-Text   Cite this paper   Add to My Lib

Abstract:

针对处理大数据时传统聚类算法失效或效果不理想的问题,提出了一种大数据的密度统计合并算法(density-basedstatisticalmergingalgorithmforlargedatasets,简称dsml).该算法将数据点的每个特征看作一组独立随机变量,并根据独立有限差分不等式获得统计合并判定准则.首先,使用统计合并判定准则对leaders算法做出改进,获得代表点集;随后,结合代表点的密度和邻域信息,再次使用统计合并判定准则完成对整个数据集的聚类.理论分析和实验结果表明,dsml算法具有近似线性的时间复杂度,能处理任意形状的数据集,且对噪声具有良好的鲁棒性,非常有利于处理大规模数据集.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133