%0 Journal Article
%T 基于声学特征空间非线性流形结构的语音识别声学模型
%A 张文林
%A 牛铜
%A 屈丹
%A 李弼程
%A 裴喜龙
%J 自动化学报
%P 1024-1033
%D 2015
%R 10.16383/j.aas.2015.c140399
%X ？从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型.将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而得到混合因子分析模型.将上下文相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型.最终,每个状态由一个服从稀疏约束的权重矢量和若干个服从标准正态分布的低维局部因子矢量所决定.文中给出了局部区域潜在维数的确定准则及模型参数的迭代估计算法.基于RM语料库的连续语音识别实验表明,相比于传统的高斯混合模型(Gaussianmixturemodel,GMM)和子空间高斯混合模型(SubspaceGaussianmixturemodel,SGMM),新声学模型在测试集上的平均词错误率(Worderrorrate,WER)分别相对下降了33.1%和9.2%.
%K 语音识别
%K 声学模型
%K 非线性流形
%K 混合因子分析
%U http://www.aas.net.cn/CN/abstract/abstract18676.shtml