全部 标题 作者
关键词 摘要


基于最大中心间隔的缩放型η-极大熵聚类算法

Keywords: 最大中心间隔,数据缩放,极大熵聚类,中心一致

Full-Text   Cite this paper   Add to My Lib

Abstract:

为了调控数据之间的差异性, 一般化的处理方式是对数据简单地进行按比例缩放, 而此类做法本身对于数据的信息是不存在任何破坏的。但在进行聚类分析时, 大部分算法对于按比缩放的数据都是很敏感的, 其中较典型的算法有极大熵聚类MEC算法。大量的实验表明, 当缩放尺度位于10-3数量级以下时, 极大熵聚类算法已经失效, 通过该算法得到的聚类中心趋于一致。为了解决上述问题, 在MEC算法的基础上引入最大中心间隔项与缩放因子η, 构造出了全新的目标函数, 称为η型最大中心间隔极大熵聚类η-MCS-MEC算法。该算法通过调控中心点间的距离使之达到最大, 并有效利用缩放因子η对各类划分进行调控, 从而避免了聚类中心趋于一致。通过在模拟数据集以及UCI仿真数据集上的实验, 结果均显示出算法对变化的数据不再敏感而具有鲁棒性。

Full-Text

comments powered by Disqus