%0 Journal Article %T 中医医案文献自动分词研究 %A 刘晓峰 %A 孙燕 %A 张帆 %J 中国中医药信息杂志 %D 2015 %X 目的 研究适用于中医医案文献自动分词的方案。方法 使用层叠隐马模型作为分词模型,建立相关中医领域词典及测试语料库,对语料库中古代医案文献和现代医案文献各300篇进行分词及评测。结果 在未使用中医领域词典时,两类医案文献分词准确率均为75%左右;使用中医领域词典后,古代医案文献的分词准确率达到90.73%,现代医案文献的分词准确率达到95.66%。在未使用中医领域词典时,词性标注准确率古代医案文献为56.74%,现代医案文献为64.81%;使用中医领域词典后,现代医案文献为91.45%,明显高于古代医案文献的78.47%。结论 现有分词方案初步解决了中医医案文献的分词问题,对现代医案文献的词性标注也基本正确,但古代医案文献的词性标注影响因素较多,还需进一步研究 %K traditional Chinese medical record literature %K automatic word segmentation %K dictionary of traditional Chinese medicine %K Hierarchical Hidden Markov Model %K part-of-speech tagging %U http://xxzz.cintcm.com//oa/darticle.aspx?type=view&id=20150212