%0 Journal Article
%T Research on the Chinese Automatic Abstracting System Based on Chunk<br>基于组块的中文自动文摘系统研究
%A 索红光
%A 曹淑英
%J 计算机系统应用
%D 2007
%I 
%X 传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.
%K 自然语言处理
%K 文本组块
%K 自动文摘
%K 统计方法
%K 向量空间模型
%K 文本组块
%K 中文
%K 自动
%K 文摘系统
%K 研究
%K Chunk
%K Based
%K System
%K Automatic
%K Abstracting
%K Chinese
%K 系统生成
%K 比较
%K 结果
%K 实验
%K 评价方法
%K 标准
%K 词语构造
%K 相关
%K 规则
%K 词性标注
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=D4F6864C950C88FFCE5B6C948A639E39&aid=181B56D34404C001BEB6F537CE3EF560&yid=A732AF04DDA03BB3&vid=7801E6FC5AE9020C&iid=38B194292C032A66&sid=C3BF5C58156BEDF0&eid=8C83C265AD318E34&journal_id=1003-3254&journal_name=计算机系统应用&referenced_num=0&reference_num=8