消噪和数学形态学结合的字符图像预处理算法

2010-06-22 03:41陈利娟徐利华
现代电子技术 2009年22期

陈利娟 徐利华

摘 要:噪声污染字符图像的预处理是字符识别技术中一项关键技术,字符识别的准确度直接取决于字符图的质量。基于消噪和数学形态学的基本原理,提出了一种预处理算法。仿真实验验证了所提出新算法的有效性和可行性。这种算法不仅能消除图像中的噪声,而且还有效地修复了笔划断裂的字符。新算法解决了识别笔划缺损字符的识别难点,从而间接地提高了字符识别技术的准确度。

关键词:数学形态学;加权平均;均值滤波;中值滤波;形态学滤波

中图分类号:TP391

0 引 言

近年来,字符识别技术已发展成为当今一个热门的主要研究领域,在许多领域都需要对字符做识别操作,例如:车牌字符识别、手写体字符识别、运动工件上的字符识别等。字符图像往往会受到各种噪声的污染,以及字符笔划断裂情况等,这些都会严重影响字符识别的准确度。许多学者针对消噪提出了一些解决方案,如:基于直方图特性的图像去噪方法,基于数学形态学的图像去噪方法,基于小波变换和中值滤波的图像去噪方法等。该类方法为消除图像噪声,以及桥接笔画断裂字符提出了一些效果好,可行的算法。

1 理论基础

文中用到的理论知识主要包括数学形态学、图像的代数运算以及图像滤波处理技术。

1.1 数学形态学方法原理

数学形态学是建立在积分几何和随机集论等严格数学理论基础上的一门密切联系实际的学科。它用于图像处理的基本思想是利用一个称作结构元素的“探针”,收集待处理图像的信息,探针在图像中不断移动,即可考察图像物体间的相互关系,提取出有用的特征。所有的形态学处理过程都是基于填充结构元素的概念。二值形态学中的运算对象是集合,通常给出一个图像集合和一个结构元素集合,利用结构元素集合对图像进行操作。

膨胀和腐蚀分别用数学符号“⊕”和“Θ”表示,若A,B是Z中的集合,h为空集,则A被结构元素B膨胀和腐蚀的定义

1.2 图像的代数运算

代数运算是指对两幅输入图像进行点对点的加、减、乘和除计算而得到输出图像的运算。图像相加的┮桓霆重要应用是对同一场景的多幅图像加权求取平均值,以达到消除加性随机噪声的目的。

式中:f(x,y)是静止图像;n璱(x,y)是加性随机噪声。┦(3)表明对N幅图像平均可把噪声方差减少㎞倍,N越大,g(x,y)就越接近于f(x,y),г肷的影响逐步减少。[JP]

1.3 滤波处理

滤波处理主要用于平滑图像、消除图像噪声的目的,最常用的祛除噪声方法是用滤波器进行滤波处理。可以根据不同的需要构造不同的空域滤波器,如均值滤波器、中值滤波器、维纳滤波器等。

1.3.1 中值滤波

中值滤波是基于排序的非线性平滑滤波器,它既可消除噪声,又能保护图象的细节[9]。中值滤波步骤为:

(1) 将模板在图像中漫游,并将模板中心与图中┠掣霆像素位置重合;

(2) 读取模板下各对应像素的灰度值;

(3) 将这些灰度值从小到大排成一列;

(4) 找出这些值中排在中间的一个;

(5) 将这个中间值赋给对应模板中心位置的像素。

[BT4]1.3.2 均值滤波

均值滤波是将一个像元及其邻域中所有像元的平均值赋给输出图像中相应的相元,从而达到平滑的目的。

2 算法实现

本文采用加权平均、形态学腐蚀以及均值滤波相结合的方法实现了消噪,并且有效地实现了比划断裂字符的桥接功能。同时将新算法的处理结果与过去常用的算法处理结果做了比较。

2.1 新算法设计并仿真实现

本文称这种算法为组合滤波桥接算法,算法设计步骤:

(1) 对噪声图像如图1所示做加权平均操作,得到加权平均图像,如图2所示,在本文中加权次数取为100即可;

(2) 选取一个结构元素对加权平均图像做膨胀操作,获得膨胀图像如图3所示;

(3) 对膨胀图像做均值滤波得到组合滤波桥接图像,如图4所示。

算法步骤说明,在经过步骤(1)后,由于加权平均消噪的原理可知,通过试探选择合适的叠加次数,仅完全消除了黑色背景上的盐噪声,而白色字体上的椒噪声仍然存在,并且从图中可以看到由于椒噪声的存在,使得字符笔划不连通,产生了间断。因此对加权平均图像做膨胀操作,膨胀结构元素通过试探的方式选取,本文经试探选取的结构元素SE=[0,1,0;1,1,1;0,1,0]。从图3可见,通过膨胀操作后,字符断裂的笔划被桥接上,但是其边缘仍存在部分噪声。所以需进行第(3)步的操作。可以看到,通过组合滤波桥接算法运算后,噪声基本被消除,笔划断裂的字符被桥接上。可见,对图4进行字符识别,可以大大提高其识别正确度,并且不再需要考虑字符笔划断裂的情况,因此用普通的字符识别算法就可得到很高的识别准确率。

2.2 组合滤波桥接算法与其他滤波桥接算法效果展示

为了能清晰地看出不同算法的滤波桥接效果,┩4~图6放大了“ea”字符串。图5是对受噪图像直接中值滤波,再用结构元素SE桥接的效果图;图6是用常用的形态学滤波消噪,再用结构元素SE桥接的效果图。