%0 Journal Article
%T 基于发音特征的音视频说话人识别鲁棒性的研究
%A 陈雁翔
%A 刘鸣
%J 电子学报
%P 2920-2924
%D 2010
%X 人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能.
%K 发音特征
%K 音视频
%K 说话人识别
%K 动态贝叶斯网络
%U http://www.ejournal.org.cn/CN/abstract/abstract6287.shtml