%0 Journal Article %T Research on the Chinese Automatic Abstracting System Based on Chunk
基于组块的中文自动文摘系统研究 %A 索红光 %A 曹淑英 %J 计算机系统应用 %D 2007 %I %X 传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容. %K 自然语言处理 %K 文本组块 %K 自动文摘 %K 统计方法 %K 向量空间模型 %K 文本组块 %K 中文 %K 自动 %K 文摘系统 %K 研究 %K Chunk %K Based %K System %K Automatic %K Abstracting %K Chinese %K 系统生成 %K 比较 %K 结果 %K 实验 %K 评价方法 %K 标准 %K 词语构造 %K 相关 %K 规则 %K 词性标注 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=D4F6864C950C88FFCE5B6C948A639E39&aid=181B56D34404C001BEB6F537CE3EF560&yid=A732AF04DDA03BB3&vid=7801E6FC5AE9020C&iid=38B194292C032A66&sid=C3BF5C58156BEDF0&eid=8C83C265AD318E34&journal_id=1003-3254&journal_name=计算机系统应用&referenced_num=0&reference_num=8