基于支持向量机的中文文本中地名识别
, PP. 433-438
Keywords: 支持向量机,中文文本,地名识别,机器学习
Abstract:
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69%和93.82%,F-值为90.12%.
Full-Text