基于《中图法》的多层自动分类影响因素分析
Keywords: 中图法,多层分类,文本分类,影响因素
Abstract:
系统总结基于《中图法》知识库的多层自动分类项目的研究经验,分析训练数据、特征词选择、分类算法、类目体系和评估方法等因素对多层自动分类的影响。围绕《中图法》,对自动分类的适应性、稀有类别的处理、知识库更新、明显正确或错误数据的标注、标准数据集的制定等进行探讨。图4。表2。参考文献9。
References
[1] | 曾元显,文本主题自动分类成效因素探讨,中国图书馆学会会报(台湾),2002(6).
|
[2] | 苏金树;张博锋;徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006(9)
|
[3] | 刘竟;朱玉梅;侯汉清.网络环境信息标引的测评与比较研究[J].中国图书馆学报,2008(1)
|
[4] | 何琳;侯汉清,基于标引经验和机器学习相结合的多层自动分类,情报学报,2007(12).
|
[5] | Sbeastinai,F,A tutorial on automated text categorization,1999.
|
[6] | 白振田,侯汉清.基于词典约简及多分类算法的文本分类系统的设计与开发[J].情报学报,2008(3)
|
[7] | 侯汉清,薛鹏军.基于知识库的网页自动标引和自动分类系统的设计[J].大学图书馆学报,2004(1)
|
[8] | 侯汉清,薛鹏军.中文信息自动分类用知识库的设计与构建[J].情报学报,2003(6)
|
Full-Text