%0 Journal Article %T 基于发音特征的音视频说话人识别鲁棒性的研究 %A 陈雁翔 %A 刘鸣 %J 电子学报 %P 2920-2924 %D 2010 %X 人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能. %K 发音特征 %K 音视频 %K 说话人识别 %K 动态贝叶斯网络 %U http://www.ejournal.org.cn/CN/abstract/abstract6287.shtml