全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
-  2018 

基于主题标签和CRF的中文微博命名实体识别
Named entity recognition of Chinese microblog based on theme tag and CRF

Keywords: 命名实体, 中文微博, 主题标签, 条件随机场,
named entity recognition
, Chinese microblog, conditional random fields(CRF)

Full-Text   Cite this paper   Add to My Lib

Abstract:

近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields, CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133