全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于语言特性的中文领域术语抽取算法

Keywords: 术语抽取,领域耦合性,领域相关性,领域一致性

Full-Text   Cite this paper   Add to My Lib

Abstract:

提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.

References

[1]  Buitelaar P,Olejnik D,Sintek M,A protege plug-in for ontology extraction from text based on linguistic analysis,Miami,USA:[s.n.],2003.
[2]  Pantel P,Lin D,A statistical corpus-based term extractor,Ottawa:[s.n.],2001.
[3]  Tomokiyo T,Hurst M,A language model approach to keyphrase extraction,Saporro,Japan:[s.n.],2003.
[4]  刘桃.刘秉权.徐志明.王晓龙 领域术语自动抽取及其在文本分类中的应用 [J].-电子学报2007(2)
[5]  Sui Zhifang,Chen Yirong,Hu Junfeng,The research on the automatic term extraction in the domain of information science and technology,Haikou,China:[s.n.],2002.
[6]  张新.党延忠 基于规则与统计的本体概念自动获取方法研究 [J].-情报学报2007(6)
[7]  Zhang H,Chinese lexical analysis using hierarchical hidden Markov model,Sapporo,Japan:[s.n.],2003.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133