双半字识别算法在水表字符识别系统中的应用

2016-10-27 06:23常英杰
关键词:字符识别水表字符

徐 平,许 彬,常英杰

(杭州电子科技大学生命信息与仪器工程学院,浙江 杭州 310018)



双半字识别算法在水表字符识别系统中的应用

徐平,许彬,常英杰

(杭州电子科技大学生命信息与仪器工程学院,浙江 杭州 310018)

水表自动抄表系统中,由于水表机械结构的原因,读数转盘常常出现进位不完全的情况,导致读数出现上下双半残缺字符,不利于识别.对这类双半字符进行研究,提出了改进的双半字识别算法.首先制作十个标准的完整双字符模板,然后根据分割的待识别双半残缺字符,从完整双字符模板中截取双半字符模板,利用改进的Hausdorff距离模板匹配进行匹配识别,最后通过比较上下半字符的比例确定字符读数.实验结果表明,算法对这类双半字符有较好的识别结果,有效地提高了水表自动抄表系统中字符识别能力.

水表字符;自动抄表;Hausdorff;模板匹配

0 引 言

随着计算机信息技术的提高,各种方便快捷的智能管理系统也将逐渐走进我们的日常生活,自动抄表系统就是一类代表[1].作为水表自动抄表系统中的基础与核心,字符识别是一项研究时间较长的课题,它与所处的具体环境密切相关,环境条件不同,识别方法也不尽相同.因此,对字符的识别仍具有很大的研究意义[2].水表自动抄表系统中,由于读数转盘进位不完全常常会出现上下双半字残缺字符,这给水表自动抄表系统中字符的自动识别带来困难.针对该问题,本文对双半字符进行分析研究,将改进的Hausdorff距离模板匹配算法用于双半字符的识别,有效地提高了因进位不完全产生的双半字符的识别率.

1 算法概述

图1 水表字符示意图

目前,我国城乡居民所用水表仍为直读式水表,如图1所示,有以下几个特征:1)字符为清晰的粗黑字体,数字和白色背景形成很高的对比度,利于图像二值化处理;2)水表码盘字符区域右边存在一个标识符m3,该字符可以作为定位水表码盘字符区域的标志;3)水表码盘字符区域依次排开五个大小一致的矩形方格,表示水表读数的个位至万位,方格之间间隔相等,水表读数的十个阿拉伯数字中的一个或者是上下两个半字符坐落在每个方格里,该特点利于单个字符的分割.根据上述特点,文中算法首先对水表字符图像做相应的预处理,然后通过模板匹配对特征标示符m3进行定位,根据m3与水表码盘字符区域的固定位置关系计算得到字符区域位置,再利用水平投影分割算法区分双半字符和单个完整字符.根据分割出的待识别双半残缺字符,从十个完整双字符模板中截取双半字模板,使用改进的Hausdorff距离模板匹配法去匹配双半字模板和待识别双半字残缺字符,得出识别结果,字符识别系统流程图如图2所示,其中双半字符识别流程如图3所示.

图2 水表字符识别系统流程图

图3 双半字符识别流程图

2 算法设计

算法设计分为图像预处理、码盘字符定位与分割、改进的Hausdorff距离模板匹配字符识别算法3部分.

2.1图像预处理

由带固定大小引导框的移动终端拍摄水表并截取引导框内字符区域图像,如图4(a)所示.因外界环境的影响,获取的图片可能存在噪声污染、亮度偏暗等干扰后续字符识别的影响因子.因此在识别字符之前,需要对水表截取图像进行预处理.本文的水表截取图像预处理包括灰度增强、均值滤波等,由于这些基本方法不是本文的研究重点,所以不再赘述.预处理之后的效果如图4(b)所示,最后二值化的效果如图4(c)所示.

图4 图像预处理过程

2.2码盘字符定位与分割

字符区域图像经过预处理以后,还需要对图1(a)所示码盘字符区域进行定位和字符分割.对于码盘字符区的定位,采用模板匹配标识符m3然后求其与字符区域相对位置的方法.衡量模板和目标子图的匹配程度可用下式测度:

(1)

式中:Si,j(m,n)为指目标子图的像素值,T(m,n)为模板的像素值,R(i,j)为匹配测度,M,N为模板宽和高.使用模板匹配的水表码盘字符区域定位具体步骤如下:

1)对水表图像进行二值化处理,二值化后的图像如图4(c)所示;

2)制作与水表标识符m3大小一致的模板,文中m3模板大小为26×19像素;

3)对水表二值图像自左至右、上到下,依次遍历,每次得到与m3模板同样大小的区域Si,i为待匹配二值图像中像素点个数;

4)计算已知m3模板与3)中得到的Si区域的匹配测度Ki;

5)在4)的所有Ki中找出最大K值,它所对应的S区域即为匹配得到的字符区域m3,计算得到m3字符的坐标位置;

6)根据水表码盘字符读数区域与m3字符之间的固定关系定位出位置,如图5(a)所示, 然后分割出字符图像如图5(b)所示.

根据水表字符的特点,本文采用求二值图像垂直方向上的灰度投影和固定规则静态边界结合的字符分割方法进行单个字符分离.具体的分割过程是:首先对字符区域图像二值化处理,使用形态学方法去除噪声、污点,然后求处理后图像垂直方向上的灰度投影,按照投影直方图把字符图像分割成5个同样大小的矩形,最后利用水平投影判断每个矩形内是整字符还是半字符.其中投影图如图5(c)所示,分割出的单个字符如图6所示.

图5 字符分割过程

图6 分割出的单个字符

2.3改进的Hausdorff距离模板匹配字符识别算法

1)Hausdorff距离原理

描述两个点的集合之间相似程度有很多度量方法,其中点集距离是一种定义形式,Hausdorff距离[3]就是这样一种点集距离.设有两组点的集合A={a1,…,an},B={b1,…,bn},那么这两个点集合之间的距离用Hausdorff距离描述为:

H(A,B)=max[h(A,B),h(B,A)],

(2)

h(A,B)=maxa∈Aminb∈B‖a-b‖,

(3)

h(B,A)=maxb∈Bmina∈A‖b-a‖.

(4)

式中:‖·‖是两个点集合A,B之间的距离范式.式(2)描述的是双向Hausdorff距离,它是最基本的一种形式.式(3)中的h(A,B)和式(4)h(B,A)分别是自集合A至集合B与自集合B至集合A的单向Hausdorff距离,即h(A,B)是对点集A中的所有点ai到距离此点ai最近的B集合中点bj之间的距离‖ai-bj‖比较,取该距离中的最大值为h(A,B)的值.同理可得h(B,A). 由式(2)知,双向Hausdorff距离H(A,B)是两个单向距离h(B,A)、h(A,B)的较大者,它实际表示的是两点集之间最大不匹配程度.

Hausdorff距离的基本思想是能够用点集合中的某一个点代表这个集合,但实际中,这个点很难找到[4].因此,在实际应用中Hausdorff距离效果并不好[5].本文在对识别字符细化的基础之上使用改进的Hausdorff距离匹配识别水表图像数字字符.细化可以有效地去除字符图像中大量冗余信息,极大地减少计算Hausdorff距离点集合时的复杂度,在图像存储和重建等需大量数学运算的算法中广泛使用[6].本文对Hausdorff距离进行改进,使用最小距离累加和求平均值来替代最大、最小距离,即:

Hd(A,B)=max[hd(A,B),hd(B,A)],

(5)

2)改进的Hausdorff距离模板匹配

对于双半字符的识别,本文采用的方法是将Hausdorff距离与模板匹配结合,试验结果显示该方法既能有效地对双半字进行识别,还可以克服噪声干扰、字符畸形的影响,性能优于参考文献[2]所提出的方法,具体流程图如图7所示.

算法步骤如下:

1)首先制作十个上下完整的双字符模板,如图8所示,模板大小为16×57像素;

2)将待识别已分割的双半字符归一化,文中将其归一化到16×32的大小;

3)对2)中归一化的双半字符在水平方向求灰度投影,由投影波形计算得到双半字符中上半字符的下切线LupLine、下半字符的上切线LdownLine,再计算得到双半字符的中位分割线Lmidline=LupLine+(LupLine-LdownLine)/2,利用中位分割线求得分割线到上边缘的距离Lupline=Lmiddleline,中位线到下边缘的距离Ldownline=32-Lmidline

4)因为1)制作的双字模板高是57,得到双字模板字符的水平中心点是29,由此计算得到半字模板上下边界值,记上边界为Hupline,下边界为Hdoweline,则Hupline=29-Lupline,Hdownline=29+Ldownline.最后根据上下边界从完整的双字模板截取得到双半字模板,如图9(c),将模板和待识别字符进行细化,待识别字符的细化结果如图9(d)所示.依次得到其他的双半字模板如图10所示;

5)分别遍历细化后的待识别字符与制作的10个双半字模板,设待识别字符的前景点集合为A,10个双半字模板的前景点集合为Bi(i=0,…,9);

6)求A集合中所有点到集合Bi(i=0,…,9)点的距离,得到其中的最短距离设为dmin,对A集合中各点对应的dmin进行累计求和求得,于是得到集合A到集合B的Hausdorff距离.用同样方法求出集合B到集合A的Hausdorff距离,计算与中的最大者即为A,B两个点集合之间的改进Hausdorff距离最终值.

7) 根据步骤5、步骤6,分别计算待识别字符与10个双半字模板中每个模板的Hausdorff距离,这样就能得到与之最佳匹配的双半字模板,由步骤3求出的Lupline和Ldownline,若Lupline>Ldownline那么取双半字上方的字符作为最终识别结果,反之,则下面的字符为识别结果.

图7 算法流程图

图8 10个双字模板

图9 待识别字符及对应匹配的双半字模板

图10 待识别字符对应的其他双半字模板

3 试验结果

本算法是在MATLAB上实现的,利用移动终端拍得多张包含有双半字符的水表图像,经过滤波、二值化、目标区域定位与分割、双半字符识别等处理能成功识别出水表读数.通过传统模板匹配法、Hausdorff距离法以及本文的识别方法对90个双半字符进行了识别对比,识别结果如表1所示.从表1知:使用传统模板匹配的字符识别结果不理想,这主要是上下双半字符的识别结果差造成的;与传统的模板匹配相比,在识别率上,Hausdorff距离匹配法有了一定层次的提升;使用文中改进Hausdorff距离模板匹配法的字符识别效果明显强于前两者,识别正确率可以到95.6%.对于无法识别的字符本文发现主要有两个原因:一是图像本身成像差、模糊严重,可能是手持终端相机拍照时抖动造成的;二是字符区域图像二值化后字符之间存在粘连过大,单个字符的分割存在较大误差造成的.

表1 水表双半字字符识别结果

4 结束语

本文针对水表字符识别系统中双半字残缺字符难以识别的问题,提出了一种有效的改进算法对水表双半字残缺字符进行识别.算法不仅可以应用于水表的字符识别,还可以应用于其它仪器仪表中的字符识别.但是,对于污染严重的水表或者预处理效果不理想的水表图像,本算法的识别率还有待改进提高.

[1]石岩峰,蔡洪光,尹佳辉.水表抄表系统的发展与趋势分析[J].科技风,2009(8):204.

[2]高菊,叶桦.一种有效的水表数字图像二次识别算法[J].东南大学学报(自然科学版),2013,43(A01):153-157.

[3]张筑生.微分动力系统原理[M].北京:科学出版社,1987:161-162.

[4]DANIEL P H,GREGORY A K,WILLIAN J R.Comparing images using the Hausdorff distance[J].IEEE Transactionson Pattern Analysis and Machine Intelligence,1993,15(9):850-863.

[5]刘福新,杜世培,陈益强.基于改进Hausdorff距离的人脸匹配方法[J].计算机工程与应用,2007,43(35):169-171.

[6]DING R, LI Y Z A Note on Hausdorff Distance[J].Mathmatical Research and Exposition,2000,20(4):511-514.

Application of Improved Double Half-word Recognition Method in Water Character Recognition System

XU Ping, XU Bin, CHANG Yingjie

(SchoolofLifeInformationandInstrumentEngineering,HangzhouDianziUniversity,HangzhouZhejiang310018,China)

In water character recognition system, it is hard to recognize the character when upper and lower half-word is incomplete because of the usual situation of partial carry caused by meter mechanical structure. To solve the problem, an improved double half-word recognition algorithm is proposed in this paper. Firstly ten standard complete two-character templates are made. Then double half-word is cut from the two-character templates based on the incomplete double half-word which is waited recognition by segmentation and the improved Hausdorff-distance template matching is applied to pattern match. Finally the character is determined by comparing the ratio of upper and lower half-word. It approves that this improved algorithm shows good recognition to this type of double half-word and improves effectively the character recognition power of automatic reading meter system in the experiment.

water meter; automatic meter reading; Hausdorff; template matching

10.13954/j.cnki.hdu.2016.01.016

2015-06-09

国家自然科学基金资助项目(61205200);杭州电子科技大学研究生科研创新基金资助项目(2014KYJJ018)

徐平(1978-),男,江西南昌人,副教授,机器视觉、工业检测.

TP391

A

1001-9146(2016)01-0080-06

猜你喜欢
字符识别水表字符
水表普查与水表挂接子系统建设
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
水表检定装置不确定度分析计算的相关思考
HBM电子称与西门子S7-200系列PLC自由口通讯
防冻水表
融合字符及字符排列特征的铭牌识别方法
一种基于OpenCV的车牌识别方法
基于MATLAB的图片中字符的分割与识别