%0 Journal Article
%T A Fast Clustering Algorithm Based on Reference and Density
一种基于参考点和密度的快速聚类算法
%A MA Shuai
%A WANG Teng-Jiao
%A TANG Shi-Wei
%A YANG Dong-Qing
%A GAO Jun
%A
马帅
%A 王腾蛟
%A 唐世渭
%A 杨冬青
%A 高军
%J 软件学报
%D 2003
%I
%X 数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法.
%K clustering
%K density
%K high dimension
%K reference
%K data mining
聚类
%K 密度
%K 高维
%K 参考点
%K 数据挖掘
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=7735F413D429542E610B3D6AC0D5EC59&aid=138F549C1926BA4D&yid=D43C4A19B2EE3C0A&vid=F3583C8E78166B9E&iid=B31275AF3241DB2D&sid=4997AFD17F6FADE1&eid=4814830A427BF9BC&journal_id=1000-9825&journal_name=软件学报&referenced_num=51&reference_num=8