OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

北京工业大学学报 2013

基于空间声学特征的说话人分类算法

Keywords: 说话人分类,多距离麦克风,空间声学特征,流型降维,优化鉴别式保局投影

Full-Text Cite this paper Add to My Lib

Abstract:

针对先验信息缺失情况下的说话人分类问题,可以采用提取基于多距离麦克风的空间声学特征的方法进行说话人分类.为了解决由于空间声学特征维数随麦克风个数的增加而迅速增长带来的计算代价问题,需要对其进行降维处理.用一种基于空间声学特征的优化鉴别式保局投影说话人分类方法,实现了在保留空间声学特征流型结构的同时降低计算代价的效果.实验在多距离麦克风语音会议数据集上进行验证,得到在大部分数据集上本方法的分类误差率(diarizationerrorrate,DER)得分低于传统方法的结果.结果表明:本方法的说话人分类性能比传统方法有所提高.

References

[1]	JACOB Benesty,CHEN Jing-dong,HUANG Yi-teng.Microphone array signal processing[M].Berlin:Springer,2008:192-193.
[2]	杨毅.基于分布式麦克风的声源定位及说话人分类研究[R].北京:清华大学,2011.YANG Yi.Research on the sound localization and speakerdiarization based on distributed microphones[R].Beijing:Tsinghua University,2011.(in Chinese)
[3]	National Institute of Standards and Technology.The 2009(RT-09)rich transcription meeting recognition evaluationplan[EB/OL].[2009-05-11].http:∥nist.gov/speech/tests/rt/2009.
[4]	王炜,吕萍,颜永红.一种改进的基于层次聚类的说话人自动聚类算法[J].声学学报,2008,33(1):9-14.WANG Wei,LPing,YAN Yong-hong.An improvedhierarchical speaker clustering[J].Journal of Acoustics,2008,33(1):9-14.(in Chinese)
[5]	TOGNERI R,ALDER M,ATTIKIOUZEL J.Dimensionand structure of the speech space[J].Communications,Speech and Vision,1992,139(2):123-127.
[6]	杨利平,龚卫国,辜小花,等.完备鉴别保局投影人脸识别算法[J].软件学报,2010,21(6):1277-1286.YANG Li-ping,GONG Wei-guo,GU Xiao-hua,et al.Complete discriminant locality preserving projections forface recognition[J].Journal of Software,2010,21(6):1277-1286.(in Chinese)
[7]	YU Wei-wei,TENG Xiao-long,LIU Chong-qing.Facerecognition using discriminant locality preservingprojections[J].Image Vis Comput,2006,24:239-248.
[8]	YANG Li-ping,GONG Wei-guo,GU Xiao-hua,et al.Null space discriminant locality preserving projections forface recognition[J].Neurocomputing,2008,71(18):3644-3649.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133