基于连通域阈值的自然场景文本图像分割技术

2015-05-25 02:26田洋洋皇甫海燕
关键词:字符纹理阈值

王 静, 田洋洋, 皇甫海燕

(1.新疆师范大学物理与电子工程学院,新疆乌鲁木齐830054;2.南昌航空大学信息工程学院,江西南昌330063)

基于连通域阈值的自然场景文本图像分割技术

王 静1, 田洋洋2, 皇甫海燕1

(1.新疆师范大学物理与电子工程学院,新疆乌鲁木齐830054;2.南昌航空大学信息工程学院,江西南昌330063)

文章探讨了三类自然场景图像的基于纹理、边缘以及连通域文本定位方法的不同特点,并选取基于阈值的连通域方法,对复杂场景中的车牌图像中的文本实现图像的分割,最后分析了此方法在自然场景文本定位方法今后的应用前景。

图像分割;自然场景;文字定位;阈值化

随着信息通信技术和无线通信的不断发展,如果能够方便快捷地从周围的自然环境中过滤和准确获取文本信息,并且能自动转换成可编辑的文本材料、或者能够转换成使用者容易辨识和理解的文字,使之成为可交流的文字代码信息。若要实现以上所述功能,如何在复杂的信息世界当中提取出有效的内容是其理论和实践中的瓶颈问题,需要一种有效的方法来对包含文本信息的图像和视频进行文本信息的识别定位和分割。在复杂背景下文本信息的识别问题包含文本定位、字符识别和单词识别[1]几个步骤。

由于自然场景中包含的文本信息的识别受到周围环境背景的颜色、文字的间距、分布、分辨率以及获取图像时的光照情况等的影响,能否准确的找到图像中文本所在的位置,或刚好包围文本的矩形区域,是准确识别文本信息的关键。

1 复杂场景文本的类别特征

根据产生的原因,复杂背景图像中的文本信息划分为:场景文本和人工文本[2]。场景文本是通过实际拍摄得到的,属于自然场景的一部分,容易受拍摄设备、拍摄光照条件和拍摄角度的影响,还有可能会与实际场景中的背景颜色发生相似而与其他物体发生相连的情况;而人工文本是在已有图像或视频中添加的较为工整、便于阅读、字符大小、颜色较为统一的文本,相对容易识别。

2 自然场景文本定位基本方法

在实现自然场景文本定位之前,首先需要准确找到图像中文本信息所具有的特征。

2.1 自然场景文本的特点

首先,文字块中色调和亮度相似度较高,周围背景的颜色信息与之对比鲜明。

其次,文字边缘一般是规则的,以水平和垂直为主,且垂直笔画高度一般是相近的,这个特征笔画和背景有较大差异。

第三,相邻字符具有的间隔和紧密性相当,字符高度及大小一般相同,文字分布集中。

第四,文本区域在水平和垂直投影曲线特征表现出明显的波峰、波谷,波峰对应字符的笔画,波谷对应字符间隙,水平轴的投影曲线无明显波峰波谷的位置则表示非文本区域。

最后,文本区域具有丰富的纹理特征[3]。

2.2 几类常见的自然场景文本定位的方法

图像中的文本定位方法包括三类:基于纹理的方法、基于边缘的方法、基于连通域的方法。基于纹理特征主要是用来区分文本区域和非文本区域;基于边缘的方法是利用边缘灰度方差或边缘密度区分出字符所在的位置;基于连通域的文本定位方法则是假定文本区域和背景区域中同一区域颜色相近,不同区域之间的色彩要有区分[4]。

纹理模式在简单背景下利用文本纹理的特征设计相应的纹理分割算法来检测文本[5],鲁棒性比较好,但是基于纹理的方法有时为了提取纹理信息,需要对全图进行微分运算来寻找微分结果较大的区域,不但费时,还难以准确找到文本区边界,另外在判断“似文本”的背景纹理区域时往往会出现较大误差。

基于边缘的方法是先利用边缘检测的方法把文本空间分为若干层子图像,然后在各层子图像中用区域生长、骨架分析等基本方法对子图像进行处理,再根据文本文字的特征对各连通域进行分析来实现文本的定位。这种方法能够用来检测形状均匀的文本目标,但是对于图像背景复杂变化程度较大的,则检测错误率较高。

基于连通域的文本定位方法假设每个字符的像素都有相似的颜色,而与背景颜色相差较大。根据字符颜色的一致性和字符颜色与背景较大的对比度分割图像。在将不同颜色层分割过后,对每一层图像进行连通域的分析,将每一层的连通域作为备选的连通域,然后再使用规则,如区域的尺寸和长宽比或者基线等来对得到的连通域进行筛选,进而得到字符[6]。基于连通域的算法具有较高的处理速度和定位精度,对系统也没有特殊的要求。为了将字符与背景区分开来,常使用的方法有图像阈值分割方法和颜色聚类的方法等。

3 基于图像阈值分割的连通域处理方法

图像阈值分割法是一种应用广泛的分割技术,利用图像中要提取的目标区域与其背景在灰度特性上的差异,把图像看作具有不同灰度级的两类区域(目标区域和背景区域)的组合,选取一个比较合理的阈值,以确定图像中每个像素点应该属于目标区域还是背景区域,从而产生相应的二值图像。阈值分割法的特点是:适用于背景或物体的灰度比较单一,灰度有较强对比,且总可以得到封闭且连通区域的边界[7]。

3.1 阈值法分割的基本原理

阈值分割法是针对图像的不同特征,比如原始图像的灰度或彩色特征,通过设定不同的特征阈值,一把图像象素点分为若干类的一种基于区域的图像分割技术。

设原始图像为f(x,y),按照一定的准则f(x,y)中找到特征值T,将图像分割为两个部分,分割后的图像为:

若将图像二值化,则取b0=0(黑),b1=1(白)。

3.2 仿真流程结构

本文取一副尺寸为256×256,位深度为8的含有车牌号的自然场景文本图像,通过阈值法实现文本分割及车牌号的定位。根据阈值法处理图像特点,先将256色原图像的位图读取RGB值,进行阈值化处理后分别得到R图像、G图像和B图像,分别对三幅图进行阈值化处理后得到阈值化处理后定位图像。程序结构图如图1所示。

图1 基于阈值法实现的结构图

3.2 仿真结果及分析

图2分别显示了原图、B图、G图、R图。

图2 未进行阈值处理的图

图3 进行阈值处理后的图

结果及分析:含有车牌号的图片通过经验的方法对图片的R,G,B分别设阈值可看到阈值化后的R,G,B图像,同时也可以求出每个像素点阈值处理后的R,G,B值,通过实验仿真,可以通过阈值法将背景和文本区域颜色反差比较明显情况下的文本区域分割。

4 总结

自然场景下的文本定位和提取工作有广泛的实际应用意义,同时也具有一定的难度和挑战性。本文采用基于连通域的阈值化区域分割方法,通过仿真举例说明本方法可以较好的实现背景与文字区域的分割。但是由于自然场景的复杂性,提出一种既鲁棒又快速的算法来提取任何自然场景中的任何类型文本将是今后工作的研究方向。

[1]孟天.自然场景下的文本定位[D].西安:西安电子科技大学,2007.

[2]欧文武,朱军民,刘昌平.自然场景文本定位[J].中文信息学报,2007,18(5):42-47.

[3]朱军民.复杂背景文本定位[D].北京:中国科学院,2003.

[4]晋瑾,平西建,张涛.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11.

[5]傅光辉,黄剑华.面向复杂场景图像的文本定位新方法[J].微计算机信息,2008,6(3):183-185.

[6]章东平,徐志江,金朝晖.彩色图像中文本的定位[J].电路与系统学报,2006,8(11):142-146.

[7]嵇新浩.基于连通域的文本定位方法研究[D].杭州:浙江工业大学,2007.

Text Image Segmentation on Connected Domain Threshold in Natural Scenes

WANG Jing1, TIAN Yang-yang2, HUANGFU Hai-yan1
(1.College of Physics and Electronic Engreering,Xinjiang Normal University,Urumqi,Xinjiang,830054,China;2.College of Information Engineering,Nanchang Aviation University,Nanchang,Jiangxi,330063,China)

This paper discusses the different characteristics about three kinds of natural scene images text-lo⁃cation methods—texture,edge and connected domain,and the author realized image segmentation from complex scene image.Finally,the author analyzed the natural scene text location method and the application prospect in the future.

Natural scene;Text location;Threshold;Image segmentation

TN911.7

A

1008⁃9659(2015)01⁃0012⁃04

2014-12-30

新疆师范大学优秀青年教师科研启动基金项目(XJNU201319)

王 静(1977-),女,河南洛阳人,讲师,硕士,主要从事信号处理与智能信息处理方向的研究。

猜你喜欢
字符纹理阈值
基于BM3D的复杂纹理区域图像去噪
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于CS-TWR的动态阈值贪婪算法成像研究
HBM电子称与西门子S7-200系列PLC自由口通讯
使用纹理叠加添加艺术画特效
基于自适应阈值和连通域的隧道裂缝提取
TEXTURE ON TEXTURE质地上的纹理