%0 Journal Article %T 聚类初始中心点选取研究 %A 杨天霞 %A 王治和 %A 王华 %A 王凌云 %J 南京师范大学学报(自然科学版) %P 161-165 %D 2010 %X 研究了利用已发现的频繁序列模式对序列数据库进行再聚类再发现的问题,针对已有的k-均值聚类算法随机选取初始中心点而导致聚类结果不稳定性的缺点,提出了一种基于huffman思想的初始中心点选取算法――k-spam(k-meansalgorithmofsequencepatternminingbasedonthehuffmanmethod)算法.该算法能够在一定程度上减少陷入局部最优的可能,而且对序列间相似度的计算采用一种高效的"与"、"或"运算,可极大提高算法的执行效率. %K k-均值 %K 序列模式 %K huffman树 %K 聚类 %K 初始中心 %U http://njsfdxzrb.paperonce.org/oa/darticle.aspx?type=view&id=20100433