OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

南京师范大学学报(工程技术版) 2011

基于改进特征值的语音分割算法研究

, PP. 73-77

任新社,缪华,马青玉

Keywords: 语音检索,语音分割,改进特征值

Full-Text Cite this paper Add to My Lib

Abstract:

随着网络技术和媒体应用的迅速发展,传统的文本检索已不能满足需要,视频检索由于数据量大而得不到应用,语音检索就显示出重要的研究价值.一个语音序列由多种不同类型的语音片段构成,而每一种类型的语音往往又包含不同的意义,因此通过语音特征进行语音分段来实现语音检索是现代媒体数据进行检索的重要手段.通过对语音信号每一帧的基本特征值与整个语音序列的平均基本特征值进行比较,得到一个改进的特征值,并利用K-NearestNeighbor算法进行语音分割,结果表明基于改进特征值的语音分割算法能够有效提高语音分割的准确性.

References

[1]	李恒峰，李国辉．基于内容的音频检索与分类[J]．计算机工程与应用，2000，36( 7) : 54-56． Li Hengfeng，Li Guohui． Content-based audio retrieval and classification[J]． Computer Engieering and Applications，2000， 36( 7) : 54-56． ( in Chinese)
[2]	朱爱红，李连．基于内容音频检索综述[J]．微机发展，2003，13( 12) : 58-61． Zhu Aihong，Li Lian． The summarization of content-based audio retrieval[J]． Microcomputer Development，2003，13( 12) : 58-61． ( in Chinese)
[3]	张燕，唐振民．基于MFCC 和HMM 的音乐分类方法研究[J]．南京师范大学学报: 工程技术版，2008，8( 4) : 112-114． Zhang Yan，Tang Zhenmin． Research of music classification based on MFCC feature and HMM model[J]． Journal of Nanjing Normal University: Engineering and Technology Edition，2008，8( 4) : 112-114． ( in Chinese)
[4]	张永皋，马青玉，孙青．基于MFCC 和CHMM 技术的语音情感分析及其在教育中的应用研究[J]．南京师范大学学报: 工程技术版，2009，9( 2) : 89-92． Zhang Yonggao，Ma Qingyu，Sun Qing． Investigation on speech emotion analyses and its application in education based on MFCC and CHMM techniques[J]． Journal of Nanjing Normal University: Engineering and Technology Edition，2009，9( 2) : 89- 92． ( in Chinese)
[5]	Foote J． An overview of audio information retrieval[J]． Multimedia Systems，1999，7( 1) : 47-59．
[6]	Saunders J． Real-time discrimination of broadcast speech /music[C]/ / Proc ICASSP96． Washington DC: IEEE Computer Society， 1996( 2) : 993-996．
[7]	Scheirer E，Slaney M． Construction and evaluation of a robust multifeature music /speech discriminator[C]/ / Proc ICASSP97． Washington DC: IEEE Computer Society，1997( 2) : 1-4．
[8]	Zhang Y B，Zhou J． Audio segmentation based on multi-scale audio classification[J]． Multimedia Systems，2004( 4) : 349- 352．
[9]	Lu L，Zhang H J，Jiang H． Content analysis for audio classification and segmentation[J]． IEEE Trans Speech Audio Process， 2002，10( 7) : 504-516．
[10]	Campbell J P，Jr． Speaker recognition: a tutorial [J]． Proceedings of the IEEE，1997，85( 9) : 1 437-1 462．
[11]	Lu L，Jiang H，Zhang H J． A robust audio classification and segmentation method[C]/ / Proc 9th ACM Int Conf Multimedia． New York: ACM，2001: 203-211．
[12]	El-Maleh K，Klein M，Petrucci G，et al． Speech /music discrimination for multimedia application[C]/ / Proc ICASSP00． Istanbul: IEEE Press， 2000: 2 445-2 448．

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133