OALib Journal期刊
ISSN: 2333-9721
费用:99美元
|
|
|
基于分类器集成的兼类词消歧研究
, PP. 144-147
Keywords: 兼类词消歧,支持向量机,条件随机场,最大熵,分类器集成
Abstract:
兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.
References
[1] | 刘开瑛.中文文本自动分词和标注[m].北京:商务印书馆,2000:162-166.
|
[2] | 钱揖丽,郑家恒.汉语语料词性标注自动校对方法的研究[j].中文信息学报,2003,18(2):33-35.
|
[3] | adwaitratnaparkh.iasimpleintroductiontomaximumentropymodelsfornaturallanguageprocess[r].philadelphia:universityofpennsylvania,techrep:ircs-97-08,1997.
|
[4] | 俞士汶,段慧明,朱学锋,等.北京大学现代汉语语料库基本加工规范[j].中文信息学报,2002,16(5):49-64.
|
[5] | 郭永辉,吴保民,王炳锡.一种用于词性标注的相关投票融合策略[j].中文信息学报,2007,21(2):9-13.
|
[6] | 姜维,关毅,王晓龙.基于条件随机域的词性标注模型[j].计算机工程与应用,2006,21:13-16.
|
[7] | 张虎,郑家恒.基于分类的汉语语料库词性标注一致性检查[j].计算机工程,2008,34(8):90-92.
|
[8] | 周强.规则和统计相结合的汉语词类标注方法[j].中文信息学报,1995,9(3):1-10.
|
[9] | 白栓虎.汉语词切分及词性自动标注一体化方法[j].中文信息,1996(2):46-48.
|
[10] | 刘群,张华平,俞鸿魁,等.基于层叠隐马模型的汉语词法分析[j].计算机研究与发展,2003,41(8):1421-1428.
|
[11] | 邓乃扬,田英杰.支持向量机―理论、算法与拓展[m].北京:科学出版社,2009:79-111.
|
[12] | laffertyj,mccalluma,pereiraf.conditionalrandomfields:probabilisticmodelsforsegmentingandlabelingsequencedata[c]//proceedingsofthe18thicml.sanfrancisco:mogankoufmann,2001:282-289.
|
[13] | 丁德鑫,曲维光,徐涛,等.基于crf模型的组合型歧义消解研究[j].南京师范大学学报:工程技术版,2008,8(4):73-76.
|
[14] | 俞士汶,段慧明,朱学锋,等.北京大学现代汉语语料库基本加工规范(续)[j].中文信息学报,2002,16(6):59-63.
|
Full-Text
|
|
Contact Us
service@oalib.com QQ:3279437679 
WhatsApp +8615387084133
|
|