|
软件学报 2005
结合限制的分隔模型及k-means算法, PP. 799-809 Keywords: 聚类分析,限制聚类,半监督学习,背景知识,机器学习 Abstract: 将数据对象间的关联限制与k-means算法结合可以取得较好的效果,但由于划分是由k个中心决定的,每一类仅由一个中心决定,分隔的表示方法限制了算法效果的进一步提高.基于数据对象间的两类限制,定义了数据对象和集合间的两类关联,以及集合间的3类关联,在此基础上给出了结合限制的分隔模型.在模型中,基于集合间的正关联,多个子集中心可以用来表示同一类,使划分的表示可以更为灵活、精细.基于此模型,给出了相应的算法cks(constrainedk-meanswithsubsets)来生成结合限制的分隔.对3个uci数据集的实验结果显示:在准确率及健壮性上,cks显著优于另一个结合关联限制的k-means类算法cop-k-means,与另一个代表性的算法ccl相比,也有相当优势;在时间代价上,cks也有一定优势.
|