OALib Journal期刊
ISSN: 2333-9721
费用:99美元
|
|
|
基于字角色标注的中文书目关键词标引研究
Keywords: 中文书目,关键词标引,字角色,序列标注,自动标引
Abstract:
中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出构建关键词角色空间模型和综合利用字序列上下文特征的设计思路。通过实验,从题名和内容提要中分别自动抽取关键词,论证该模型的合理性和实用性。图6。表3。参考文献23。
References
[1] | 章成志;苏新宁,基于条件随机场的自动标引模型研究,中国图书馆学报,2008(5).
|
[2] | Chu C M;O\'Brien A,Subject analysis: The first critical stages in indexing,Journal of Informa tion Science,1993(6).
|
[3] | 王昊;严明;苏新宁,基于机器学习的中文书目自动分类研究,中国图书馆学报,2011(5).
|
[4] | 李素建;王厚峰;俞士汉,关键词自动标引的最大熵模型应用研究,计算机学报,2004.
|
[5] | 张雪英;Jürgen Krause,中文文本关键词自动抽取方法研究,情报学报,2008(4).
|
[6] | 徐文海;温有奎,一种基于TFIDF方法的中文关键词抽取算法,情报理论与实践,2008(2).
|
[7] | 张庆国;薛德军;张振海,海量数据集上基于特征组合的关键词自动抽取,情报学报,2006(5).
|
[8] | 杨洁;季铎;蔡东风,基于联合权重的多文档关键词抽取技术,中文信息学报,2008(6).
|
[9] | 王灿辉;张敏;马少平,基于相邻词的中文关键词自动抽取,广西师范大学学报(自然科学版),2007(2).
|
[10] | 章成志,基于集成学习的自动标引方法研究,情报学报,2010(1).
|
[11] | Zhang K;Xu H;Tang J,Keyword extraction using support vector machine,Hong Kong,China,2006.
|
[12] | 黄昌宁;赵海,由字构词——中文分词新方法,2006.
|
[13] | Quinlan J R,Induction of decision tree,Ma chine Learning,1986(1).
|
[14] | Hecht-Nielsen R,Theory of the back propagation neural network,Proceedings of International Joint Conference on Neural Networks IEEE,1989.
|
[15] | Cortes Corinna;Vapnik V,Support-vector network,Machine Learning,1995(20).
|
[16] | Friedman N;Geiger D;Goldszmidt M,Bayesian network classifiers,Machine Learning,1997(29).
|
[17] | Zhou Guodong;Su Jian,Named entity recognition using an HMM-based chunk tagger,Phila delphia,2002.
|
[18] | Olover B;Franz J O;Hermann M,Maximum entro py models for named entity recognition,Edmonton,Canada,2003.
|
[19] | Settles B,Biomedical named entity recognition u sing conditional random fields and rich feature sets,Geneva,Switzerland,2004.
|
[20] | 王昊;苏新宁,基于CRFs的角色标注人名识别模型在网络舆情分析中的应用,情报学报,2009(1).
|
Full-Text
|
|
Contact Us
service@oalib.com QQ:3279437679 
WhatsApp +8615387084133
|
|