全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

Research on the Chinese Automatic Abstracting System Based on Chunk
基于组块的中文自动文摘系统研究

Keywords: 自然语言处理,文本组块,自动文摘,统计方法,向量空间模型,文本组块,中文,自动,文摘系统,研究,Chunk,Based,System,Automatic,Abstracting,Chinese,系统生成,比较,结果,实验,评价方法,标准,词语构造,相关,规则,词性标注

Full-Text   Cite this paper   Add to My Lib

Abstract:

传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133