%0 Journal Article %T 基于主题标签和CRF的中文微博命名实体识别<br>Named entity recognition of Chinese microblog based on theme tag and CRF %A 朱颢东 %A 杨立志 %A 丁温雪 %A 冯嘉美< %A br> %A ZHU Haodong %A YANG Lizhi %A DING Wenxue %A FENG Jiamei %J 华中师范大学学报(自然科学版) %D 2018 %X 近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields, CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.<br %K 命名实体 %K 中文微博 %K 主题标签 %K 条件随机场 %K < %K br> %K named entity recognition %K Chinese microblog %K conditional random fields(CRF) %U http://journal.ccnu.edu.cn/zk/CN/abstract/abstract8082.shtml