全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于分类器集成的兼类词消歧研究

, PP. 144-147

Keywords: 兼类词消歧,支持向量机,条件随机场,最大熵,分类器集成

Full-Text   Cite this paper   Add to My Lib

Abstract:

兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.

References

[1]  刘开瑛.中文文本自动分词和标注[m].北京:商务印书馆,2000:162-166.
[2]  钱揖丽,郑家恒.汉语语料词性标注自动校对方法的研究[j].中文信息学报,2003,18(2):33-35.
[3]  adwaitratnaparkh.iasimpleintroductiontomaximumentropymodelsfornaturallanguageprocess[r].philadelphia:universityofpennsylvania,techrep:ircs-97-08,1997.
[4]  俞士汶,段慧明,朱学锋,等.北京大学现代汉语语料库基本加工规范[j].中文信息学报,2002,16(5):49-64.
[5]  郭永辉,吴保民,王炳锡.一种用于词性标注的相关投票融合策略[j].中文信息学报,2007,21(2):9-13.
[6]  姜维,关毅,王晓龙.基于条件随机域的词性标注模型[j].计算机工程与应用,2006,21:13-16.
[7]  张虎,郑家恒.基于分类的汉语语料库词性标注一致性检查[j].计算机工程,2008,34(8):90-92.
[8]  周强.规则和统计相结合的汉语词类标注方法[j].中文信息学报,1995,9(3):1-10.
[9]  白栓虎.汉语词切分及词性自动标注一体化方法[j].中文信息,1996(2):46-48.
[10]  刘群,张华平,俞鸿魁,等.基于层叠隐马模型的汉语词法分析[j].计算机研究与发展,2003,41(8):1421-1428.
[11]  邓乃扬,田英杰.支持向量机―理论、算法与拓展[m].北京:科学出版社,2009:79-111.
[12]  laffertyj,mccalluma,pereiraf.conditionalrandomfields:probabilisticmodelsforsegmentingandlabelingsequencedata[c]//proceedingsofthe18thicml.sanfrancisco:mogankoufmann,2001:282-289.
[13]  丁德鑫,曲维光,徐涛,等.基于crf模型的组合型歧义消解研究[j].南京师范大学学报:工程技术版,2008,8(4):73-76.
[14]  俞士汶,段慧明,朱学锋,等.北京大学现代汉语语料库基本加工规范(续)[j].中文信息学报,2002,16(6):59-63.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133