|
自动化学报 2008
基于动态贝叶斯网络的音视频联合说话人跟踪DOI: 10.3724/SP.J.1004.2008.01083, PP. 1083-1089 Keywords: 说话人跟踪,动态贝叶斯网络,粒子滤波,麦克风阵列 Abstract: ?将多传感器信息融合技术用于说话人跟踪问题,提出了一种基于动态贝叶斯网络的音视频联合说话人跟踪方法.在动态贝叶斯网络中,该方法分别采用麦克风阵列声源定位、人脸肤色检测以及音视频互信息最大化三种感知方式获取与说话人位置相关的量测信息;然后采用粒子滤波对这些信息进行融合,通过贝叶斯推理实现说话人的有效跟踪;并运用信息熵理论对三种感知方式进行动态管理,以提高跟踪系统的整体性能.实验结果验证了本文方法的有效性.
|