All Title Author
Keywords Abstract

-  2018 

基于主题标签和CRF的中文微博命名实体识别
Named entity recognition of Chinese microblog based on theme tag and CRF

Keywords: 命名实体, 中文微博, 主题标签, 条件随机场,
named entity recognition
, Chinese microblog, conditional random fields(CRF)

Full-Text   Cite this paper   Add to My Lib

Abstract:

近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields, CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.

Full-Text

comments powered by Disqus

Contact Us

service@oalib.com

QQ:3279437679

微信:OALib Journal