%0 Journal Article %T 基于多尺度图匹配核的场景单字识别方法 %A 史存召 %A 王春恒 %A 肖柏华 %A 张阳 %A 高嵩 %J 自动化学报 %P 751-756 %D 2014 %R 10.3724/SP.J.1004.2014.00751 %X ?由于自然场景中的文字具有较大的类内间距,因此识别场景文字具有很大的挑战性.本文提出了一种基于多尺度图匹配核的场景单字识别方法.为了利用字符特有的结构特征,将每幅图像表示为基于不同网格划分的无向图,通过计算两个无向图之间图匹配的最优能量值来得到两幅图像的相似度,由于图匹配在计算每个节点的最佳匹配节点时也考虑了相邻节点之间的空间位置约束,因此可以应对具有一定形变的文字.通过图匹配得到的两幅图像之间的相似度很适合用来构造支持向量机的核矩阵.本文将不同尺度网格划分下得到的核矩阵进行多核融合,使得最终得到的核矩阵更加地鲁棒.在国际公开场景文字识别数据集Chars74k和ICDAR03-CH上的实验结果表明,本方法取得了高于国际上已发表的其他方法的单字识别率. %K 文字识别 %K 结构信息 %K 图匹配 %K 能量函数 %K 核矩阵 %K 梯度直方图特征 %K 支持向量机 %U http://www.aas.net.cn/CN/abstract/abstract18341.shtml