%0 Journal Article
%T Method of Maximum Entropy Model for Language Processing<br>语言信息处理技术中的最大熵模型方法
%A 李素建
%A 刘群
%A 张志勇
%A 程学旗
%J 计算机科学
%D 2002
%I 
%X 1 引言进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等。这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x)。在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同。这类问题可以采用统计建模的方法去处理。首先是采集大量样本进行训练,样本代表了该任务的知识和信息,选取样本的好坏确定了知识完整性的程度。然后建立一个统计模型,并把样本知识结合到模型中,来预测随机过程将来的行为。
%K 语言信息处理
%K 最大熵模型
%K 汉语信息处理
%K 自然语言处理
%K 语义分析
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=BA023CABBEDCFFDD&yid=C3ACC247184A22C1&vid=771469D9D58C34FF&iid=DF92D298D3FF1E6E&sid=6270DC1B5693DDAF&eid=4DB1E72614E68564&journal_id=1002-137X&journal_name=计算机科学&referenced_num=6&reference_num=11