全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2002 

利用串匹配技术实现网上新闻的主题提取

, PP. 159-167

Keywords: 网页信息处理,网上新闻,主题提取,串匹配,

Full-Text   Cite this paper   Add to My Lib

Abstract:

从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据"词典加匹配"的模式.由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度,而且词典的内容也无法完全涵盖网上新闻的范围,因此这种方法不适用于网上新闻的主题提取.提出并实现了一种不用词典即可提取新闻主题的新方法.该方法利用网上新闻的特殊结构,在标题和正文间寻找重复的字串.经过简单地处理,这些字串能够较好地反映新闻的主题.实验结果显示该方法能够准确、有效地提取出绝大部分网上新闻的主题,满足新闻自动处理的需要.该方法同样适用于其它亚洲语言和西方语言.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133