%0 Journal Article
%T Method of New Chinese Word Detection Based on Statistical Learning Framework ZHANG Hai-ju
基于统计学习框架的中文新词检测方法
%A 张海军
%A 栗静
%A 李勇
%A 齐向伟
%J 计算机科学
%D 2012
%I
%X 新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出 一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模 型作为框架来整合不同类型的可用特征,以充分发挥特征之间的组合作用,进一步改善新词检测效果。实验表明,统 计框架方法的性能明显地优于特征的简单叠加,能有效提高新词检测效果,开放实验和封闭实验的F值分别为49. 72 0 0 和69. 83 0 o,达到了目前的较好水平。
%K Statistical framework
%K New words detection
%K Repeats
%K Linguistic knowledge feature
%K Statistical feature
统计框架,新词检测,重复模式,语言知识特征,统计特征
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=A72829DDE955E0D26458B3569339DFCC&yid=99E9153A83D4CB11&vid=7C3A4C1EE6A45749&iid=0B39A22176CE99FB&sid=FBCA02DBD05BD4EA&eid=1DF3F9D75A12D97B&journal_id=1002-137X&journal_name=计算机科学&referenced_num=0&reference_num=0