%0 Journal Article %T 异态汉字识别方法研究 %A 王恺? %A 李成学? %A 王庆人? %A 赵宏? %A 张健? %J 软件学报 %P 2266-2281 %D 2014 %R 10.13328/j.cnki.jos.004502 %X 复杂图像文字识别是基于内容图像检索的一个重要研究方向.针对图像中的文字可能存在倾斜、光照不均、噪音干扰和边缘柔化等多种异态问题,提出一种有效的异态汉字识别方法,称作sc-hog.首先,利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化;然后,利用梯度方向直方图抽取复原图像的汉字边缘梯度特征,削弱倾斜和光照的影响;最后,将获取的特征向量送入分类器,实现异态汉字的识别.通过合成数据集和真实数据集两方面的实验来验证sc-hog方法的有效性:前一方面实验结果表明,sc-hog方法对于倾斜、光照不均、噪音干扰和边缘柔化等异态情况有较强的鲁棒性;后一方面实验结果表明,sc-hog方法在原生数字图像和场景图像真实样本集上也能取得较好的结果. %K 稀疏编码 %K 梯度方向直方图 %K 增量线性决策分析 %K 汉字识别 %K 文档图像处理 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=4502&flag=1