一种基于枢纽现象和加权离群分数的离群数据挖掘算法
Keywords: 离群挖掘,枢纽现象,逆k近邻,离群分数,满意值
Abstract:
摘要 针对高维数据集中出现的枢纽现象,本文给出了一种基于枢纽现象和加权离群分数的离群数据挖掘算法.该算法首先根据逆k近邻中出现的枢纽现象,以及与离群数据的关系,利用k近邻中的距离信息作为权值,对逆k近邻的离群分数进行加权;其次随机生成区分度阈值,根据该阈值判断区分度比例满意值,并根据满意值计算数据对象的离群程度,选取离群程度最大的若干数据对象作为离群数据;最后采用人工数据集和UCI标准数据集,实验验证了该算法的有效性
Full-Text