|
中山大学学报(自然科学版) 2016
一种抗噪的自然场景图片预处理算法模型Keywords: 笔画宽度转化,图像分割,双斜率分割法,Radon转化,图像识别,OCR Abstract: 摘要 随着大数据时代的到来,基于自然场景图片的文字识别技术将大大提高海量图像内容检索的效率,为了利用成熟的OCR软件将自然场景中的文本识别出来,提出一种抗噪的自然场景图片预处理算法模型.该算法模型分为文本区域筛选、文本区域二值分割和文本校正三步骤,针对这三步骤分别提出了对应的三个算法.文本区域筛选采用基于角点的笔画宽度转化算法,文本区域二值化分割采用一维Otsu的双斜率分割法,文本校正采用基于Radon变换的分步投影算法.通过四个实验的验证结果可知,该算法模型文本区筛选精度高、抗噪性能强、算法复杂度适中,能适合各种角度的文本区域识别.
|