基于规则的人物信息抽取算法的研究
, PP. 134-139
Keywords: 文本信息抽取,人物信息抽取,人物属性规则,抽取算法
Abstract:
随着互联网的快速发展,信息也呈爆炸式增长,如何从海量的文本信息中获取所需的信息成为当今一门重要的课题.检索、分类、抽取等文本信息处理技术取得了长足发展,但面向人物属性的自动信息提取却没有引起人们的重视.基于规则的人物信息抽取算法,首先对需要抽取的信息进行规则描述,重点是时间、地点、籍贯等信息.在规则的基础上,研究开发人物信息抽取系统,最终实现了半结构化人物属性信息的自动提取.
References
[1] | luhnhp.theautomaticcreationofliteratureabstracts[j].ibmjournalofresearchdevelopment,1958,2(2):159.
|
[2] | schiffmanb,manii,concepcionk.producingbiographicalsummaries:combininglinguisticknowledgewithcorpusstatistics[c]//proceedingsofthe39thannualmeetingoftheassociationforcomputationallinguistics(acl’2001).newbrunswick,newjersey:associationforcomputationallinguistics,2001:450-457.
|
[3] | 周婷.异构信息源的领域人物信息抽取研究[d].北京:哈尔滨工业大学计算机科学与技术学院,2010:6.
|
[4] | zhongzm,liuzt,lich,etal.identifyingkeypeoplefromasingledocumentusingpeopleeventmap[j].journalofcomputationalinformationsystems,2010,6(1):17-23.
|
[5] | hayneschan,w-ou,anders,etal.ictclas[eb/ol].[2012-08-29].http://baike.baidu.com/view/1215398.htm.
|
[6] | 颜伟王,洁尚英,宋柔.《中国大百科全书》人物传记知识提取加工规范语言[c]//全国第七届计算语言学联合学术会议论文集.哈尔滨,2003.
|
[7] | 易平,刘宗田,周文.人物传记研究综述[j].计算机工程与设计,2009,30(14):3426-3428.
|
[8] | hanyj,parksy,parksb,etal.reconstructionofpeopleinformationbasedonaneventontology[c]//proceedingsofinternationalconferenceonnaturallanguageprocessingandknowledgeengineering.beijing,2007:446-451.
|
[9] | 任宁.大规模真实文本中的人物职衔信息抽取研究[d].北京:北京语言大学信息科学学院,2008:4-7.
|
[10] | 邓凯元,姜磊.正则表达式匹配引擎性能分析[j].计算机与现代化,2011(7):105-110.
|
Full-Text