%0 Journal Article %T 基于模式链分析的文本页面图像的分割与分类 %A 李艳玲 %A 王加俊 %J 中国图象图形学报 %D 2005 %R 10.11834/jig.200506145 %X 为了能对复杂版式的文本图像(如包含镶嵌在文字中的形状不规则的图片区)的页面进行图文分割与分类,提出了一种新的基于模式链分析的文本页面分割与分类算法。该算法首先使用外接矩形框出图像中的所有黑像素,并且存入矩形框链表中,再组合所有相邻的矩形进而形成模式,最后依据各模式的统计特征分类,输出文字区和图片区两类图像。另外,对大图片模式周围个别不确定的模式,本文采用了上下文分类的算法进行再次分类。实验结果表明,该算法不仅运算速度快,而且能够对复杂版式的页面图像进行正确的图文分割和分类。 %K 矩形框链表 %K 模式链表 %K 模式上下文 %K 页面分割和分类 %U http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=200506145&flag=1