全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

互信息与模糊c均值聚类集成的特征优选方法

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对大型数据中大量冗余特征的存在可能降低数据分类性能的问题,提出了一种基于互信息(mi)与模糊c均值(fcm)聚类集成的特征自动优选方法fcc-mi。首先分析了互信息特征及其相关度函数,根据相关度对特征进行排序;然后按照最大相关度对应的特征对数据进行分组,采用fcm聚类方法自动确定最优特征数目;最后基于相关度对特征进行了优选。在uci机器学习数据库的7个数据集上进行实验,并与相关文献中提出的基于类内方差与相关度结合的特征选择方法(wcmfs)、基于近似markovblanket和动态互信息的特征选择算法(b-ambdmi)及基于互信息和遗传算法的两阶段特征选择方法(t-mi-ga)进行对比。理论分析和实验结果表明,fcc-mi不但提高了数据分类的效率,而且在有效保证分类精度的同时能自动确定最优特征子集,减少了数据集的特征数目,适用于海量、数据特征相关性大的特征约简及数据分析。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133