|
天津大学学报(自然科学与工程技术版) 2015
基于目标逼近特征和双向联想贮存器的情感语音基频转换DOI: 10.11784/tdxbz201507028, PP. 670-674 Keywords: 情感语音合成,定量目标逼近,高斯双向联想贮存器,基频转换 Abstract: 提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(qta)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(gbam)实现中性合成语音音节层qta参数向目标情感语音音节层qta参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的qta参数作为源数据,将情感录音中提取的qta参数作为目标数据,进行gbam转换模型的训练.在情感语音合成阶段,利用训练得到的gabm模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(mllr)模型自适应方法更好的情感表现力.
|