|
自动化学报 2007
基于Viterbi算法的粘连断裂印刷体数字行切分识别方法DOI: 10.1360/aas-007-0315, PP. 315-322 Keywords: 字符切分,OCR,粘连断裂字符,Viterbi算法,印刷体数字行 Abstract: ?粘连断裂字符行的切分识别,是很多OCR实际应用中存在的主要困难之一.本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi算法的切分识别方案,该方案采用两次切分识别的层次型结构.在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi算法来合并前面得到的候选切分图像块,进行动态切分与识别.实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性.
|