全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2006 

一种基于划分的孤立点检测算法

, PP. 1009-1016

Keywords: 数据挖掘,孤立点检测,划分,cd-tree(cell,dimension,tree),基于单元的算法

Full-Text   Cite this paper   Add to My Lib

Abstract:

孤立点是不具备数据一般特性的数据对象.划分的方法是通过将数据集中的数据点分布的空间划分为不相交的超矩形单元集合,匹配数据对象到单元中,然后通过各个单元的统计信息来发现孤立点.由于大多真实数据集具有较大偏斜,因此划分后会产生影响算法性能的大量空单元.由此,提出了一种新的索引结构--cd-tree(celldimensiontree),用于索引非空单元.为了优化cd-tree结构和指导对数据的划分,提出了基于划分的数据偏斜度(skewofdata,简称sod)概念.基于cd-tree与sod,设计了新的孤立点检测算法.实验结果表明,该算法与基于单元的算法相比,在效率及有效处理的维数方面均有显著提高.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133