全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

无关语获取与语料聚类方法研究

Keywords: 无关语,获取,识别,算法

Full-Text   Cite this paper   Add to My Lib

Abstract:

剔除无关语及语料聚类对提高自然语言理解的质量具有重要意义,也是自然语言理解的预处理关键技术.鉴于无关语在语料中存在明显的特性,本文通过种子无关语推导出强无关语,并依据强无关语识别并导出新的无关语;然后,基于2-gram构建句子之间的相似性,利用层次法对语料进行聚类对qa语料进行问题相似的聚类.最后,通过识别的新无关语实验及语料聚类实验,验证本文提出方法的有效性.

References

[1]  段良涛,郭曙超.中文文本校对技术研究[j].电脑知识与技术,2014,10(19):4601-4604.
[2]  陈智鹏.基于统计的搜索引擎中文输入纠错技术研究[d].北京:北京邮电大学电子工程学院,2010.
[3]  李晨,巢文涵,陈小明,等.中文社区问答中问题答案质量评价和预测[j].计算机科学,2011,38(6):230-236.
[4]  李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[j].计算机应用研究,2003,20(12):15-21.
[5]  陈力为,袁琦.计算语言学进展与应用[m].北京:清华大学出版社,1995.
[6]  刘群,李素建.基于《知网》的词汇语义相似度计算.http://www.keenage.com.
[7]  王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类[j].计算机应用,2010,30(3):603-606.
[8]  刘汉兴,林旭东,田绪红.基于本体的自动答疑系统的研究与实现[j].计算机应用,2010,30(2):415-418.
[9]  冯成,陈智敏.领域本体建模方法的研究[j].科学技术与工程,2009,9(2):455-459.
[10]  骆正华,樊孝忠,刘林.本体论在自动问答系统中的应用[j].计算机工程与应用,2005,41(32):229-232.
[11]  俞士汶.基于骨架依存树的语句相似度计算模型[c]//中文信息处理国际会议(iccip’98),北京,1998.
[12]  崔恒,蔡东风,苗雪雷.基于网络的中文问答系统及信息抽取算法研究[j].中文信息学报,2004,18(3):24-31.
[13]  keijiyasuda,fumialisuagya,etc.anautomaticevaluationmethodoftranslationqualityusingtranslationanswercandidatesqueriedfromaparallelcorpus[c]//proceedingofmtsummit’sconference,santiagodecompostela,2001.
[14]  yaojianmin,zhouming.anautomaticevaluationmethodforlocalizationorientedlexicalisedebmtsystem[c]//proceedingofthe19thinternationalconferenceoncomputationallinguistics,taipei,2002.
[15]  yasuhiroakiba,kenjiimamura,eiichirosumita.usingmultipleeditdistancestoautomaticallyrankmachinetranslationoutput[c]//proceedingofmtsummit’sconference,santiagodecompostela,2001.
[16]  sambasivam,theodosopoulos.advanceddataclusteringmethodsofminingwebdocuments[j].issuesininformingscienceandinformationtechnology,2006,8(3):563-579.
[17]  hanj,kamberm.数据挖掘概念与技术[m].第二版.范明,孟小峰,译.北京:机械工业出版社,2006.
[18]  孙吉贵,刘杰,赵连宇.聚类算法研究[j].软件学报,2008,19(1):48-61.
[19]  来社安,蔡中民.基于相似度的问答社区问答质量评价方法[j].计算机应用与软件,2013,30(2):266-269.
[20]  黄河燕,陈肇雄,张孝飞,等.大规模句子相似度计算方法[j].中文信息学报,2006,(z1):47-52.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133