全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于改进lle的高维数据离散化方法

Full-Text   Cite this paper   Add to My Lib

Abstract:

连续特征值离散化在数据挖掘、机器学习和模式识别等领域显得尤为重要。目前,现有的离散化方法主要处理低维数据,然而,现实世界中往往存在的是高维非线性数据。基于此,提出一种基于改进局部线性嵌入(lle)的高维数据离散化方法——ille-hd3方法。首先,通过考虑数据的类信息对lle方法进行改进,使其有效降维,以便于数据在低维空间中离散化。其次,在降维的基础上,提出了基于差异-相似集合(dss)的连续特征值离散化算法,该算法利用类与特征之间的关联程度来决定连续域中断点的选取位置,并通过dss理论定义分类错误标准,以控制连续域划分过程中产生的信息损失。最后,使用决策树分类工具c4.5和c5.0进行性能分析,结果表明,提出的ille-hd3方法处理高维非线性数据时具有较好的效果,与现有的方法相比,得到了较高的分类精度。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133