|
软件学报 1999
汉语语音听写机技术的研究与实现, PP. 436-444 Keywords: 连续语音识别,汉语语音听写机,搜索策略,基于统计知识的帧同步搜索算法,差分状态驻留,特征变化量,词搜索树,双层搜索网络,汉语语音听写机引擎,语音命令. Abstract: 文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了n-gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在pc机上构建了两个系统:非特定人汉语语音听写机
|