|
中国图象图形学报 2001
A Fast and Effective Algorithm for Printed Chinese Character Recognition
|
Abstract:
为了利用低成本的硬件来实现对印刷体文字的快速识别,提出了一种基于多级分类的印刷体文字快速识别算法,该算法从预处理、特征提取,到模式匹配各个阶段,都对传统方法作了合理的改进.该算法首先是采用36×36,而不是传统的48×48点阵进行归一化,从而有效地减少了计算量和字典容量;其次是采用改进的粗外围特征,并进行二重分割,以提高特征的稳定性;最后在各级分类中采用了不同的判别准则,包括绝对值距离、欧氏距离及相似度准则,以适应于时间、准确性的不同要求.同时用该算法对一级汉字7000个样本进行了实验,其结果表明,实际正确识别率(正识率)达95%,前5位累积正识率可达98%,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础.