全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

一种数据规约的近似挖掘方法的实现

DOI: 10.11830/ISSN.1000-5013.2008.03.0370

Keywords: 近似挖掘, 数据规约, 属性选择, 实例选择

Full-Text   Cite this paper   Add to My Lib

Abstract:

讨论基于数据规约的近似挖掘技术,在数据预处理阶段对海量数据集进行数据规约.近似数据挖掘的工作流程包括任务定义、数据准备与预处理、数据挖掘建模、结果的解释与评估、模型发布与应用5个阶段.同时,提出使用属性选择和实例选择方法实现近似挖掘的方案,并对该方案进行挖掘效率和结果模型准确性的分析评估.该方案能满足对企业级大数据集进行高效挖掘的需要.

References

[1]  University of California. UCI machine-learning-databases [DB/OL]. ftp://ftp.ics.uci.edu/pub/machine-learning-databases/adult, 2006.
[2]  BIUM L, LANGLEY P. Selection of relevant features and examples in machine learning [J]. Artificial Intelligence, 1997, (1-2):245-271.
[3]  邵峰晶, 于忠清. 数据挖掘原理与算法 [M]. 北京:中国水利水电出版社, 2003.
[4]  DUNHAM H. Data mining course [M]. 北京:清华大学出版社, 2003.
[5]  HALL M A, HOLMES G. Bench marking attributes selection techniques for discrete class data mining [J]. IEEE Transactions on Knowledge and Data Engineering, 2003(3):1-16.
[6]  KOHAVI R, JOHN H. Wrappers for Feature Subset Selection [J]. Artificial Intelligence, 1997, (1-2):273-324.
[7]  HALL A. Correlation-based feature selection for machine learning [D]. Hamilton:University of Waikato, 1998.
[8]  DASH M, LIU H, MOTODA H. Consistency based feature selection [A]. Berlin:springer-verlag, 2000.98-109.
[9]  HAND D, MANNILA H, SMYTH P. Data mining principle [M]. 北京:机械工业出版社, 2003.
[10]  GREINER R. Probabilistic hill-climbing:Theory and applications [A]. 1992.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133