%0 Journal Article %T 基于深层神经网络的藏语识别* %A 袁胜龙 %A 郭武 %A 戴礼荣 %J 模式识别与人工智能 %P 209-213 %D 2015 %R 10.16451/j.cnki.issn1003-6059.201503003 %X 文中首次涉及藏语的自然对话风格大词汇电话连续语音识别问题.作为一种少数民族语言,藏语识别面临的最大的困难是数据稀疏问题.文中在基于深层神经网络(DNN)的声学模型建模中,针对数据稀疏的问题,提出采用大语种数据训练好的DNN作为目标模型的初始网络进行模型优化的策略.另外,由于藏语语音学的研究很不完善,人工生成决策树问题集的方式并不可行.针对该问题,文中利用数据驱动的方式自动生成决策树问题集,对三音子隐马尔可夫模型(HMM)进行状态绑定,从而减少需要估计的模型参数.在测试集上,基于混合高斯模型(GMM)声学建模的藏字识别率为30.86%.在基于DNN的声学模型建模中,采用三种大语种数据训练好的DNN网络作为初始网络,并在测试集上验证该方法的有效性,藏字识别正确率达到43.26%. %K 藏语 %K 连续语音识别 %K 数据驱动 %K 深层神经网络(DNN) %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract10320.shtml