基于图像边缘检测的图像识别算法

2015-12-07 06:57秦雪王欢严晔吴玉宁苏伟
关键词:图像识别直方图梯度

秦雪,王欢,2,严晔 ,吴玉宁,苏伟 ,2

(1.长春理工大学 计算机科学技术学院,长春 130022;2.长春理工大学 信息化中心,长春 130022)

图像识别技术在现代计算机科学中已经得到了广泛的研究和发展,并且运用到了生产生活的各个方面,例如人脸识别,指纹识别,机动车监控等。传统灰度图像识别系统[1]如图1所示。传统灰度图检测方法,由于具有良好的匹配效果,确切的定量分析,大量的实验结果,目前得到了广泛的应用。但是,此类方法仍然存在对图像识别精度不高、复杂度高等缺点。本文基于边缘检测图像识别算法,通过优化灰度图像识别系统流程图,提出了一种新的边缘检测图像识别算法,提高了图像识别的精度,分析了算法的优缺点和实际使用的可行性。

图1 灰度图像识别系统

1 算法流程改进思想

1.1 算法基本流程

算法主要思想是改进识别流程图的决策判断部分。将其流程优化为提取图像边缘、计算边缘梯度矩阵、建立梯度直方图、计算偏离方差、确定判定条件五个部分,基本流程如图2所示。

图2 基于边缘检测图像识别流程图

首先,提取待测对象边缘。通过分析此边缘图像的矩阵,保留图像中为待测对象边缘的对应像素点,本文中称作有效像素。然后,对原图中有效像素计算偏导数,得到原图中有效像素的梯度矩阵,最后分析此梯度矩阵得到边缘梯度的匹配标准。通过判定条件过滤掉待测对象中边缘梯度并不契合的对象。

在这种方法中,使用了有效像素,虽然匹配效率变高,但是时间复杂度增加。

1.2 级联分类器训练

基于灰度特征的级联分类器训练[2]是边缘检测图像识别算法的基础,它提供了一个有效的图像识别研究平台。Haar-like特征[3],如图3所示。

图3 Haar-like特征库

可以使用五个要素来描述这些矩形:在图像中的坐标x,y,矩形横向距离w和矩形纵向距离h,以及矩形与水平方向的夹角α。根据灰度图像特征描述公式:

其中每一个矩形的特征值计算公式:

2 基于Canny算法边缘检测

2.1 Canny算法

为实现对图像边缘像素提取,首先通过canny算子[4]计算统计平均,使图像像素的高斯分布趋于平衡。假如设定如下二维高斯函数公式:

可以得到的此高斯函数的导数公式:

导数公式表示图像灰度变化率相对水平的倾斜方向,通过卷积得到图像像素沿这两个方向的偏导数公式:

公式中k为自然数,e表示高斯参数,它表示图像的像素平衡程度。然后,通过一阶偏微分卷积方法求出的变化率的大小公式:

和倾斜角度公式:

2.2 边缘提取结果

本文采用Canny算子大小为3×3,阈值范围(56~168)。

在文中,由于矩阵行列数过多,因此只截取边缘矩阵第151~154行,第356~350列作为分析矩阵,可见通过Canny算法求取边缘后,灰度变化率方向上的像素灰度值达到峰值,最后通过双阈值算法将边缘图像连接起来,实际效果如图4所示。

图4 边缘提取效果对比图

图像中可以看出机器人的大致轮廓能够被识别出来,机器人轮廓线和阈值参数有关。过于高的阈值设定会使轮廓线会减少。这也是基于边缘检测图像识别算法的一个局限所在,只能够根据具体的图像做出最优的选择。

3 Sobel算子计算边缘梯度矩阵

3.1 Sobel算子

Sobel算子是用来求取图像矩阵的偏导数的算子[5]。假设为图像矩阵函数,其中(x ,y)图像矩阵中的行和列的位置,别分对应此行和列的像素灰度值,则由一阶导数得到像素的梯度公式:

同样得到矢量模的大小公式:

Sobel算子能够对0度和90度两个方向上的梯度进行检测分析,将接近于这两个方向的梯度划分成两组。其中梯度函数公式:

根据三角函数性质得到像素倾角公式:

3.2 梯度方向提取结果

算子包括两组3×3矩阵,拓展内核为1。

在本文中,由此公式得到的梯度矩阵截取第151~154行,第356~350列矩阵为

进而求出整个图像的像素点的倾角矩阵

由于通过矩阵计算出边缘倾角矩阵,此方法增加了算法复杂度。

4 直方图匹配

4.1 灰度直方图

灰度直方图[6]是灰度值的统计图形,以图形的方式反映图像灰度分布情况,灰度直方图分为两个类型。一是标准灰度直方图,表示像素个数和灰度值大小的关系;二是归一化的直方图,表示同一灰度值大小的像素所占百分比和灰度值的关系。灰度图一维表示公式和归一化公式如下:

根据归一化公式计结果,得到某一灰度值的在整个图像像素中所占概率,是图像像素总数。

灰度直方图直观的统计特性,为图像识别判定原则提供了方便的工具。

4.2 灰度变换

通常使用的彩色图像一般都是RGB格式。图像中红、绿、蓝三个分量所占比例是不同的[7]。按照加权的方式可以将三种颜色色值转化为灰度图像灰度值。

例如某像素点RGB分量分别为(R,G,B),像素灰度公式如下:

R,G,B,V的大小范围从0~255。根据如上公式的比例因子,将彩色的三色色值加权求和,保存成灰度图像,再把0~255分成n个灰度级别对这些灰度级别进行直方统计。

根据需要本文将读取的标准图像和待识别的视频提取图像全部转换为灰度图像进行操作。

4.3 灰度直方图匹配结果

将标准差应用于图像质量标准[8],可以使图像统计数据更健全利于分析,标准差定义公式如下:

边缘像素变化率和水平方向的夹角(边缘倾角、梯度方向)可以取180个方向的角度,因此建立直方图有180个灰度级,其中横坐标对应180个角度,纵坐标对应同一角度的像素出现频率,根据倾角数据绘制灰度图。建立灰度图[9],如图5所示。为过滤匹配项,增加识别判定准则也就是匹配识别距离d,其公式为:

其中θi为待匹配图像的某一倾角频率值,αi为原图同一倾角频率值。

通过比较基于两幅图的边缘倾角建立的灰度图像的相似程度,便可以得到分析数据来判定此两幅图是否具有相似的灰度分布,从而识别出待识别的物体。

对比两幅图像边缘梯度方向也就是边缘倾角分布情况。通过计算的方差统计,求出最优在匹配识别距离d,以达到最优的匹配效果。

图5 倾角矩阵直方图

5 实验结果

本实验所用设备为处理器core i7,显卡GTX660M,内存8G,在VS2010,C++语言环境下采用cascade方法训练的级联分类器,训练样本400张。匹配过程中图像经过灰度转化,比例缩小,缩小因子1.1,识别框矩形大小为30~50。

对比结果如图6所示,基于边缘检测匹配,识别效果优于传统灰度图像识别系统。图中可以观察到,传统灰度图像匹配下有6个待选识别框,而边缘检测匹配算法只有1个匹配识别框。改进后的在此单帧下优化了83.3%。

图6 图像识别对比结果

如表1所示,对于匹配识别距离d的不同取值得到了不同的匹配效果,随着d的减小,图像识别精度不断提高。但随着匹配识别距离d减小到临界值时,识别效果达到顶峰。

表1 匹配效率数据

如图7所示,如果采用图像的某一帧分析,就会发现得到的效率曲线并不是一直随着匹配识别距离的减小而提高。当d取值为0.05时,达到峰值,但随后匹配效率急剧下降,甚至匹配框消失。过低的匹配识别距离意味着待测图像和原图之间的差异非常小,而待测图像和原图并不是完全一致的,一些满足条件的匹配框也被过滤掉了。此方法并不能够适应一些多变的环境,局限性非常明显。

图7 单帧识别率随匹配距离d变化值

实验结果表明,基于边缘检测的图像识别使普通识别效率最高提高了80%。但是匹配识别距离的局限性使得此效率不能够再提升。而且匹配识别距离只能依靠具体的条件才能得到最优效果,并不能够自适应各种图像识别。

6 结论

基于边缘检测的图像识别算法,保持了传统图像识别的优点,提高了图像识别效率。传统图像识别的基础上增加了新的判定准则,为实现图像匹配识别进行了有益的探索。但是仍然存在识别速度慢,匹配识别距离自适应性差,Canny算法的自适应性差等问题,有待于进一步研究解决。

[1]王明潇.图像识别算法研究及其智能终端上的实现[D].北京:北京邮电大学,2010.

[2]Prem Kuchi,Prasad Gabbur,P Subbanna Bhat,et al.Human face detection and tracking using skin color modeling and connected component operators[J].IETE Journal of Research,2002,48(3-4):289-293.

[3]王明潇.图像识别算法研究及其智能终端上的实现[D].北京:北京邮电大学,2010.

[4]王植,贺赛先.一种基于Canny理论的自适应边缘检测方法[J].中国图象图形学报,2004,9(08):65-70.

[5]袁春兰,熊宗龙,周雪花,等.基于Sobel算子的图像边缘检测研究[J].激光与红外,2009,39(1):85-87.

[6]李小利,阮秋琦,阮成雄.基于灰度直方图的加权模板匹配法在摄像机标定中的应用[J].北京交通大学学报,2013,37(2):22-26.

[7]张学荣,雷国伟.基于灰度直方图的背景差目标检测算法[J].计算机安全,2010(2):45-47.

[8]张小利,李雄飞,李军.融合图像质量评价指标的相关性分析及性能评估[J].自动化学报,2014,40(2):306-315.

[9]王润鸿.基于视觉加权的最大连通面积直方图检索[J].长春理工大学学报:自然科学版,2013,36(1-2):110-114.

猜你喜欢
图像识别直方图梯度
符合差分隐私的流数据统计直方图发布
一个带重启步的改进PRP型谱共轭梯度法
一个改进的WYL型三项共轭梯度法
随机加速梯度算法的回归学习收敛速度
基于FPGA的直方图均衡图像增强算法设计及实现
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
一个具梯度项的p-Laplace 方程弱解的存在性
用直方图控制画面影调
图像识别在物联网上的应用