|
计算机应用 2012
基于样本空间分布密度的改进次胜者受罚竞争学习算法Keywords: 聚类,次胜者受罚竞争学习算法,样本密度,聚类数目,聚类中心 Abstract: ?针对传统次胜者受罚竞争学习(rpcl)算法忽略数据集几何结构对节点权值调整的影响,以及魏立梅等提出的新rpcl算法(魏立梅,谢维信.聚类分析中竞争学习的一种新算法.电子科学学刊,2000,22(1):13-18)引入密度来对节点的权值进行调整时,密度定义的主观性,提出基于样本空间分布密度的改进rpcl算法。该算法根据数据集样本自然分布定义样本密度,将此密度引入rpcl节点权值调整;使用uci机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集对算法进行实验测试,对算法确定数据集类簇数目的准确率、运行时间、聚类误差平方和、聚类结果的rand指数、jaccard系数以及adjustrandindex参数进行分析比较。各项实验结果显示:所提算法优于原始rpcl算法和魏立梅算法,具有更好的聚类效果,对噪声数据有很强的抗干扰性能。所提算法不仅能根据样本的自然分布确定数据集的合理类簇数目,而且能确定合适的类簇中心,提高聚类的准确性,使聚类结果尽可能快地收敛到全局最优解。
|