混合优化的RBF网络车牌字符识别

2017-05-12 04:20张秀玲侯代标程艳涛
沈阳大学学报(自然科学版) 2017年2期
关键词:字符识别隐层车牌

张秀玲, 齐 晴, 侯代标, 程艳涛, 付 栋

(燕山大学 a. 河北省工业计算机控制工程重点实验室; b. 国家冷轧板带装备及工艺工程技术研究中心, 河北 秦皇岛 066004)



混合优化的RBF网络车牌字符识别

张秀玲a,b, 齐 晴a, 侯代标a, 程艳涛a, 付 栋a

(燕山大学 a. 河北省工业计算机控制工程重点实验室; b. 国家冷轧板带装备及工艺工程技术研究中心, 河北 秦皇岛 066004)

应用RBF神经网络对车牌字符进行识别.在网络中心参数确定阶段,对每类字符分别采用最近邻聚类和k-均值聚类相结合的算法来确定隐层中心值,从而解决传统k-均值聚类算法中初始聚类中心需要被人为确定的问题;中心宽度通常通过公式来确定,为了消除此方法对中心值的依赖性,选择遗传算法对中心宽度进行优化;输出层连接权值则采用违逆法确定.仿真结果表明,设计的RBF神经网络可以有效地识别字符.

车牌; 字符识别; 径向基函数神经网络(RBFNN); 聚类; 遗传算法

随着模式识别技术的发展,车牌字符识别已经成为智能交通系统的重要组成部分[1],而字符识别的准确与否是评判系统性能的重要指标.对于车牌字符识别,目前最常用的方法是基于模板匹配的方法和基于神经网络的方法两大类.前者多利用了字符的轮廓、网格、投影等统计特征,相似字符区分能力差,且因特征数据维数过大会导致识别速度慢;而后者在神经网络中,由于各个神经元的结构与功能较为简单[2],具有一定的自适应的学习与组织能力,可以通过调整连接权值完成分类、识别等复杂的功能,因此,神经网络可对笔画模糊的字符准确识别,是一种应用广泛的识别方法[3-4],但是存在网络输入数据的选择和网络结构设计等问题.常用神经网络有BP神经网络、RBF神经网络等[5-6].RBF网络的关键是对隐层神经元参数的确定,隐层神经元个数对网络抗干扰能力有重大影响,如何确定隐层中心值最重要,若所选中心值不够准确,则无法实现隐层到输出层的映射关系;隐层中心宽度也在一定程度上影响网络的分类能力.因此本文应用聚类与遗传相结合的算法对RBF神经网络进行优化设计,对每类字符分别采用最近邻聚类和k-均值聚类[7]相结合的算法来确定隐层中心值,使用遗传算法对中心宽度进行优化,最后对分割的字符进行识别.

1 灰度字符图像预处理

RBF神经网络字符识别流程图如图1所示.

图1 RBF神经网络字符识别流程图

字符识别前需要归一化及特征提取,本文只对基于梯度直方图[8-9]的特征提取法进行介绍,过程如下:

(1) 首先将灰度字符图像分成细胞(cell)和块(block).

(2) 计算灰度图中单个像素的梯度值,公式如下所示,其中gx(x,y)表示水平梯度,gy(x,y)表示垂直梯度.gx(x,y)通过算子[-1,0,1]与图像卷积求得,gy(x,y)通过算子[-1,0,1]T求得.

(1)

(3) 计算单个细胞以及块的梯度直方图特征从而构成整个图像的灰度梯度直方图特征.

2 RBF神经网络结构原理

RBF神经网络拓扑图如图2所示,它是具有三层结构的网络,其工作原理如下:首先特征向量通过输入神经元被传递到隐层节点;然后隐层节点通过径向基函数对输入向量进行非线性运算.图2中,ri(x)表示径向基函数,通常选高斯函数为映射函数,公式如下:

(2)

式中,x是输入向量;ci是第i个隐层神经元中心值;σi为隐层中心宽度,可通过下式求得:

(3)

式中,d表示任意两个隐层神经元中心值最大欧氏距离;m是隐层神经元个数.

最后隐层输出通过输出权值映射到输出层神经元,网络输出为

(4)

式中,yk代表输出层单个神经元响应;p表示神经元总数;wik代表输出权值[10-11].

图2 RBF神经网络结构拓扑图

3 聚类与遗传混合优化的字符识别RBF网络设计

本文设计两个网络用于汉字和后6位字符的识别.在RBF网络中,需要利用无标签数据来计算构成隐层的高斯单元参数,因此在本文中首先分别对每类字符采用最近邻聚类和k-均值聚类相结合的算法来确定隐层中心值,从而解决聚类算法中初始中心需要被人为确定的问题;中心宽度选择遗传算法对其进行优化;输出层连接权值则采用违逆法确定.

3.1 最近邻聚类确定初始聚类中心

① 依次计算每类字符中单个特征向量与其余向量的欧式距离和,并存入矩阵DIT中.

② 确定DIT中最小值dit及其对应的向量ci,并将其存入初始聚类矩阵C中.

③ 依次计算特征向量与ci的欧式距离,若该欧式距离小于距离ditmean,则该向量属于聚类中心ci,并将该输入向量删除.ditmean计算公式如下,其中n为每类字符样本个数.

(5)

④ 将剩余的向量重新进行迭代循环,直到向量个数小于阈值thre为止,设thre=5.

3.2k-均值聚类确定最终聚类中心

① 将前一节确定的各类字符聚类中心分别作为k-均值聚类算法的初始聚类中心[12].

② 将各特征向量分派到与其距离最近的聚类中心数据集中,并对误差平方和进行计算:

(6)

③ 计算各数据集中向量均值,以该均值为新聚类中心并由式(7)计算误差平方和enew.

④ 对enew与e做差,如果差的绝对值比设定的阈值小,转至步骤⑤,否则转至步骤②;

⑤ 输出k个聚类中心值,将每个聚类中心所包含的训练数据的个数从多到少依次累加,若累加和大于所有训练数据的90%,则将这些数据所对应中心作为该类字符的最终聚类中心.

3.3 遗传算法确定隐层中心宽度

一般情况下,隐层中心宽度的确定常采用式(3)进行,但是当隐层中心值的选取不太合理时,整个网络的分类效果将会受到影响,故本文选用遗传算法[13-14]确定中心宽度.选择网络实际输出与标准输出的均方误差来构造适应度函数.在隐层中心值已知、中心宽度设为优化变量且标准输出确定的情况下,输出权值可由下式求得,

(7)

(8)

(9)

那么网络的实际输出为:

(10)

式中,H为隐层输出矩阵;W为连接权值矩阵;D为标准输出矩阵.

4 字符识别实验结果与分析

本文中每类字符样本数均为100个,每类20个字符当做训练样本,80个字符做测试样本,通过遗传算法工具箱来优化中心宽度,用GA对中心宽度进行构造适应度函数,并在其他参数求取算法相同的条件下对中心宽度采用式(3)确定的网络进行测试,比较识别结果.并将适应度函数编写为M文件,并对GUI界面中有关参数(交叉、变异概率)设定,利用MATLAB中的GUI界面开发工具箱设计了一个车牌识别系统界面.

4.1 分别对字母、数字和汉字优化和识别

在字母、数字识别试验中,由于数字1的宽度比其余字符要小,因此可以通过字符的宽度来区分,故数字1 不在本次识别范围之内. 通过前面算法得到RBF网络输入层神经元数为180,隐层神经元数为68,输出层神经元数为33,GA优化过程及优化结果如图3所示,从图3a中可知当遗传算法运行到35代多时,优化函数达到极小值,其中最优适应度达到0.004 285 5,平均适应度值为0. 008 785 3.本文在其他参数求取算法相同的条件下对中心宽度采用式(3)确定的网络进行测试,字符部分识别结果如表1所示.对比表1两种算法的字符识别率可知,采用式(3)确定中心宽度的RBF网络对0、2、R的识别率要远低于遗传算法确定中心宽度的神经网络,因此可通过调整中心宽度的方法来增强网络的泛化性能.由于实验条件所限,本文实验数据没有太多的汉字样本,只提取了三类汉字样本,分别是津、冀、鲁,每类汉字样本数为100,对三类汉字进行了识别,通过前面算法得到输入层神经元数为180,隐层神经元数为6,输出层神经元数为3,GA优化过程及优化结果如图4所示,从图4a中可知当遗传算法运行到50多代时,优化函数达到极小值,其中最优适应度达到0,平均适应度值为0. 001 178 5.三类汉字识别结果如表2所示,表中测试样本个数分别为80个.文中设计的RBF神经网络分为训练阶段和测试阶段,实验结果表明,只要训练好数据之后,在测试阶段的字符识别会很快,效率很高,也具有一定的实时性.

图3 识别数字字母的RBF网络中心宽度GA优化过程及结果

字符中心宽度不同的网络识别率%中心宽度一定的网络识别率%095.085.0210076.2396.096.0496.097.5510098.7695.098.7797.596.0897.598.7字符中心宽度不同的网络识别率%中心宽度一定的网络识别率%9100100A98.798.7B100100C96.097.5D96.098.7E98.798.7R95.091.2

表2 汉字样本识别率统计

图4 识别汉字的RBF网络中心宽度GA优化过程及优化结果

4.2 基于MATLAB环境的车牌识别GUI界面搭建

实际的车牌识别系统包括车牌定位、字符分割、字符识别功能.由于这三个功能相对独立,为了使仿真结果有更好的直观性,利用MATLAB中的GUI界面开发工具箱设计了一个车牌识别系统界面.车牌识别系统界面如图5所示.

图5 车牌识别GUI界面

5 结 论

本文采用最近邻聚类与k-均值聚类算法相结合来确定隐层神经元中心值的方法,解决了传统k-均值聚类算法中需要人为确定初始聚类中心的问题;采用遗传算法对隐层中心宽度进行优化,解决了当隐层中心值的选取不太合理时,整个网络的分类效果将会受到较大影响的问题.仿真实验结果表明,该算法设计的字符网络识别精度高,具有良好的应用前景.

[ 1 ] 李志强,李永斌. 车牌识别技术的发展及研究现状[J]. 科技信息, 2012(5):110-125. (LI Z Q, LI Y B.The Development and research status of license plate recognition technology[J]. Science & Technology Information, 2012(5):110-125.)

[ 2 ] 李小平,任江兴,杨德刚,等. 车牌识别系统中若干问题的探讨[J]. 北京理工大学学报, 2001,21(1):116-119. (LI X P, REN J X, YANG D G, et al. Study on automobile license plate identification systems[J]. Journal of Beijing Institute of Technology, 2001,21(1):116-119.)

[ 3 ] 邹明明,卢迪. 基于改进模板匹配的车牌字符识别算法实现[J]. 国外电子测量技术, 2010(1):59-61. (ZOU M M, LU D. Recognition algorithm of car license plate characters based on modified template match[J]. Foreign Electronic Measurement Technology, 2010,29(1):59-61.)

[ 4 ] CHOUDHARY A, RISHI R. Improving the character recognition efficiency of feed forward BP neural network[J]. International Journal of Computer Science & Information Technology, 2011,3(1).

[ 5 ] 孟繁静,王连明. 视频人脸识别系统中的最佳人脸捕获[J]. 东北师大学报(自然科学版), 2015,47(3):90-95. (MENG F J, WANG L M. Optimal face capture in video-based face recognition system[J]. Journal of Northeast Normal University(Natural Science Edition), 2015,47(3):90-95.)

[ 6 ] 刘文伟,李琳,张洪剑,等. 基于神经网络的复杂过程系统模型辨识[J]. 沈阳大学学报, 2009,21(2):102-104. (LIU W W, LI L, ZHANG H J, et al. Model identification of complex process systems based on neural networks[J]. Journal of Shenyang University, 2009,21(2):102-104.)

[ 7 ] 刘明术. 基于K-均值聚类的混合聚类算法[J]. 安庆师范学院学报(自然科学版), 2016,22:40-42. (LIU M S. Hybrid clustering algorithm based on thek-means clustering[J]. Journal of Anqing Teachers College(Natural Science Edition), 2016,22:40-42.)

[ 8 ] LUO H B, YU X, LIU H, et al. A method for real-time implementation of HOG feature extraction[J]. Proceedings of SPIE, 2011,8193(4):819302-819302-7.

[ 9 ] 殷羽,郑宏,高婷婷,等. 基于联合HOG特征的车牌识别算法[J]. 计算机工程与设计, 2015(2):476-481. (YIN Y, ZHENG H, GAO T T, et al. Algorithm of license plate recognition based on joint HOG feature[J]. Computer Engineering and Design, 2015(2):476-481.)

[10] SHAN B. Vehicle license plate recognition based on text-line construction and multilevel RBF neural network[J]. Journal of Computers, 2011,6(2):246-253.

[11] 周腾. 基于RBF神经网络的车牌识别技术的研究[D]. 哈尔滨: 哈尔滨理工大学, 2012:41-50. (ZHOU T. Research on technology of license plate Recognition Based on RBF neural network[D]. Harbin: Harbin University of Science and Technology, 2012:41-50.)

[12] 王赛芳,戴芳,王万斌,等. 基于初始聚类中心优化的K-均值算法[J]. 计算机工程与科学, 2010,32(10):105-107. (WANG S F, DAI F, WANG W B. AK-means algorithm based on the optimal initial clustering center[J]. Computer Engineering & Science, 2010,32(10):105-107.)

[13] DING S, XU L, SU C, et al. An optimizing method of RBF neural network based on genetic algorithm[J]. Neural Computing and Applications, 2012,21(2):333-336.

[14] 姜鹏飞,蔡之华. 基于遗传算法和梯度下降的RBF神经网络组合训练方法[J]. 计算机应用, 2007,27(2):366-368. (JIANG P F, CAI Z H. Combined algorithms for training RBF neural networks based on genetic algorithms and gradient descent[J]. Computer Applications, 2007,27(2):366-368.)

【责任编辑: 李 艳】

License Plate Recognition of RBF Neutral Network Based on Mixed Optimization

ZhangXiulinga,b,QiQinga,HouDaibiaoa,ChengYantaoa,FuDonga

(a. Key Laboratory of Industrial Computer Control Engineering of Hebei Province; b. National Engineering Research Center for Equipment and Technology of Cold Strip Rolling, Yanshan University, Qinhuangdao 066004, China)

RBF neural network is used to identify characters of license plate. In the network center parameter determination stage, the nearest neighbor clustering algorithm and thek-mean clustering algorithm are used to determine the center of the hidden layer for each class of characters, so as to solve the problem that initial cluster center in the traditionalk-means clustering algorithm needs to be artificially determined; Normally, central width is determined by the formula, in order to eliminate its dependence on the center value, the genetic algorithm is selected to optimize the center width. The weights of the hidden layer and output layer are determined by violating law. The simulation results show that the designed RBF neural network can effectively recognize the characters.

license plate; character recognition; RBFNN; clustering; genetic algorithm

2016-10-21

河北省自然科学基金-钢铁联合研究基金资助项目(E2015203354); 河北省高校创新团队领军人才培育计划资助项目(LJRC013); 河北省教育厅科学研究计划河北省高等学校自然科学研究重点项目(ZD2016100); 河北省高等教育学会高等教育科学研究课题重点课题(GJXHZ2015-1); 燕山大学研究生教育教学教学改革项目(JG201610).

张秀玲(1968-),女,山东章丘人,燕山大学教授,博士.

2095-5456(2017)02-0113-05

TP 183

A

猜你喜欢
字符识别隐层车牌
基于RTD可编程逻辑门的n变量函数实现算法
基于BP神经网络学习算法的图像压缩技术研究
数字图像处理技术在车牌识别系统中的应用
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
一种改进深度学习网络结构的英文字符识别
第一张车牌
基于MATLAB 的车牌识别系统研究
仪表字符识别中的图像处理算法研究
基于CUDA和深度置信网络的手写字符识别