%0 Journal Article %T 基于粗糙集技术的压缩近邻规则 %A 翟俊海 %A 李胜杰 %A 王熙照? %J 计算机科学 %D 2012 %X 近部(nearestneighbor,nn)算法是一种简单实用的监督分类算法。但nn算法在分类未知类标的样例时,需要存储整个训练集,还要计算该样例到训练集中每一个样例之间的距离,所以nn算法的计算复杂度非常高。为了克服这一缺点,p.hart提出了压缩近部(condensednearestneighbor,cnn)规则算法,即从整个il}练集中找原样例集的一致子集(一致子集是能正确分类训练集中其他样例的子集)。其计算复杂度依然比较高,特别是对于大型数据库,寻找其一致子集是非常耗费时间的。针对这一问题,提出了基于粗糙集技术的压缩近部规则算法。该算法分为3步,首先利用粗糙集方法求属性约简(特征选择),以将冗余的属性去掉。然后选取靠近边界域的样例,以将冗余的样例去掉。最后从选出的样例中计算一致子集。该算法能同时沿垂直方向和水平方法进行数据约简。实验结果显示,所提出的方法是行之有效的。 %K 近邻规则 %K 一致集 %K 样例选择 %K 粗糙集 %K 边界域 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120255&flag=1