OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

软件学报 2006

基于机器学习的文本分类技术研究进展

, PP. 1848-1859

苏金树？,张博锋？,徐昕？

Keywords: 自动文本分类,机器学习,降维,核方法,未标注集,偏斜数据集,分级分类,大规模文本分类,web页分类

Full-Text Cite this paper Add to My Lib

Abstract:

文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133