全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

融合领域知识短语树核函数的中文领域实体关系抽取

DOI: 10.13232/j.cnki.jnju.2015.01.025, PP. 181-186

Keywords: 领域知识树,核函数,隐式关系抽取,支持向量机

Full-Text   Cite this paper   Add to My Lib

Abstract:

针对在核函数方法中,传统短语树只包含通用领域信息难以训练出适应特定领域关系抽取模型的问题,本文提出一种融入领域知识短语树的中文领域实体关系抽取方法.基于web上中文特定领域网站的信息结构特点,构建出能反映特定领域实体语义关系的领域知识树,并将其融合到实例句的句法树中,得到特定领域实体语义树.然后通过支持向量机训练,得到实体关系的分类模型,对特定领域实体关系进行抽取.在收集的600篇旅游领域语料上进行关系抽取实验,结果表明:本文所提出的方法优于不融入领域信息的方法,f值提高了3.4.

References

[1]  车万翔,刘挺,李生.实体关系自动抽取.中文信息学报,2005,19(2):1~6.
[2]  郭剑毅,李真,余正涛等.领域本体概念实例、属性和属性值的抽取及关系预测.南京大学学报(自然科学),2012,48(4):383~389.
[3]  黄瑞红,孙乐,冯元勇等.基于核方法的中文实体关系抽取研究.中文信息学报,2008,22(5):102~108.
[4]  zhangj,ouyangy,liwj,etal.anovelcompositekernelapproachtochineseentityrelationextraction.lecturenotesincomputerscience,2009,5459:236~247.
[5]  qianll,zhougd.treekernel-basedprotein-proteininteractionextractionfrombiomedicalliterature.journalofbiomedicalinformatics,2012,45(3):535~543.
[6]  虞欢欢,钱龙华,周国栋等.基于合一句法和实体语义树的中文语义关系抽取.中文信息学报,2010,24(5):17~23.
[7]  pengc,gujh,qianlh.researchontreekernel-basedpersonalrelationextraction.communicationsincomputerandinformationscience,2012,333:225~236.
[8]  liudd,zhaozw,huyn.incorporatinglexicalsemanticsimilaritytotreekernel-basedchineserelationextraction.lecturenotesincomputerscience,2013,7717:11~21.
[9]  郭剑毅,薛征山,余正涛.基于层叠条件随机场的旅游领域命名实体识别.中文信息学报,2009,23(5):47~52.
[10]  collinsm,duffyn.covolutionkernelsfornaturallanguage.neuraltreeinformationprocessingsystems:naturalandsynthetic(nips’2001),cambridge,ma,2001:625~632.
[11]  zelenkod,aonec,richardellaa.kernelmethodsforrelationextraction.journalofmachinelearningresearch,2003,3(6):1083~1106.
[12]  奚斌,钱龙华,周国栋等.语言学组合特征在语义关系抽取中的应用.中文信息学报,2008,22(3):44~49,63.
[13]  leicy,guojy,yuzt,etal.thefieldofautomaticentityrelationextractionbasedonbinaryclassifierandreasoning.in:the3rdinternationalsymposiumoninformationprocessing.qingdao,china,2010:327-2~331.
[14]  qianlh,zhougd,zhuqm.exploitingconstituentdependenciesfortreekernel-basedsemanticrelationextraction.in:2008internationalconferenceoncomputationallinguistics(coling’2008),manchester,uk,2008:697~704.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133