全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于统计学习框架的中文新词检测方法

Keywords: 统计框架,新词检测,重复模式,语言知识特征,统计特征

Full-Text   Cite this paper   Add to My Lib

Abstract:

新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模型作为框架来整合不同类型的可用特征,以充分发挥特征之间的组合作用,进一步改善新词检测效果。实验表明,统计框架方法的性能明显地优于特征的简单叠加,能有效提高新词检测效果,开放实验和封闭实验的f值分别为49.7200和69.830o,达到了目前的较好水平。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133