%0 Journal Article %T 基于层次划分的最佳聚类数确定方法 %A 陈黎飞? %A 姜青山? %A 王声瑞? %J 软件学报 %P 62-72 %D 2008 %X 确定数据集的聚类数目是聚类分析中一项基础性的难题.常用的trail-and-error方法通常依赖于特定的聚类算法,且在大型数据集上计算效率欠佳.提出一种基于层次思想的计算方法,不需要对数据集进行反复聚类,它首先扫描数据集获得cf(clusteringfeature,聚类特征)统计值,然后自底向上地生成不同层次的数据集划分,增量地构建一条关于不同层次划分的聚类质量曲线;曲线极值点所对应的划分用于估计最佳的聚类数目.另外,还提出一种新的聚类有效性指标用于衡量不同划分的聚类质量.该指标着重于簇的几何结构且独 %K 聚类 %K 聚类有效性指标 %K 统计指标 %K 聚类数 %K 层次聚类 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=20080107&flag=1