全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于改进c-value方法的中文术语抽取

Keywords: 术语抽取,串频统计,语言规则,术语度

Full-Text   Cite this paper   Add to My Lib

Abstract:

?提出一种改进c-value的术语抽取方法,即ic-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术语;对候选术语进行语言规则过滤;从逆文档频率、破碎子串和术语长度三个方面改进c-value方法得到ic-value方法,并用来计算候选术语的术语度。以1000篇乙型肝炎相关论文进行实证研究,结果证明ic-value方法在准确率和召回率方面都要优于c-value、tf-idf和v-value,有较强的长术语发现能力,且识别破碎子串的效果十分明显。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133