全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

Web数据反馈的搭配抽取方法

DOI: 10.11918/j.issn.0367-6234.2010.02.023, PP. 281-285

Keywords: 搭配,共现频率,互信息,卡方检验,语料库,Web

Full-Text   Cite this paper   Add to My Lib

Abstract:

为了提高搭配(Collocation)抽取的精度,提出一种新的互联网数据的搭配抽取方法.传统的搭配抽取统计方法都是基于语料库的,常受到语料库规模的影响和制约,而在互联网数据中蕴含着丰富的知识和信息,基于Web的词汇相关性度量方法,充分利用搭配在谷歌中的页面数模拟其对应语料库的词频数,并分别选取共现频率、互信息、卡方检验3种经典统计关联度量方法.实验结果表明召回率、精确率均好于对应的基于语料库的方法,这说明互联网中大量数据应用于自然语言处理各种任务的可行性.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133