吴晓刚,汪静
(1.兴义民族师范学院信息技术学院,兴义562400;2.同济大学计算机科学与技术系,上海201804)
目前国内外车牌文字图像识别的主要方法有模糊聚类[1]、基于模板匹配[2]和人工神经网络[3]等算法。基于模板匹配和模糊聚类的算法实现简单且当字符较规整时识别率高,但对于一些因光照不均或污损遮挡的文字,在实际应用中效果不理想。人工神经网络尤其深度神经网络对硬件的要求较高。针对此类模糊车牌文字识别一些学者作了研究,如文献[4]提供了一种基于主成分特征重建图像的车牌文字识别方法。
本文在具有三种否定的模糊集IFScom[5]理论基础上,提出了一种基于IFScom 贴近度的模糊车牌文字识别方法。该算法针对模糊文字像素空间分布特点,结合IFScom 贴近度包含中介否定信息来描述模糊污损图像的灰度特性。通过理论和实验分析,在对模糊图像文字的识别中,计算的准确率和效率有明显提高。
定义1[5]设A 是论域X 的模糊子集,其隶属函数为A(x),l∈(0.5,1)。
(1)若映射满足f┑:{A(x)|x∈X}→[0,1],f┑(A(x))=1-A(x),则f┑确定了论域X 上的一模糊子集,称为A 的对立否定集,记作A┑。当A(x)∈[0,1-l]或A(x)∈(l,1];
(2)若映射f~:{A(x)|x∈X}→[0,1],满足:
则该映射f┑(A(x))=1-A(x)确定了X 上的模糊子集A 的中介否定集,记作A~。
(3)设A 是论域X 上的一个的模糊集,∀x∈X,称A┐为A 的矛盾否定集,若A┐(x)=(A┑∪A~(x)=A┑(x)∨A~(x)=max(A┑(x),A~(x))。
定义1 为区分矛盾否定运算┐、对立否定运算┑和中介否定运算~的模糊集IFScom。
贴近度反应了两个模糊集的贴近程度或相似程度。以下给出公理化的定义和可计算的贴近度。
定义2[6]设F(X)是论域X 上的模糊集,若映射σ:F(X)×F(X)→[0,1],(A,B)|→σ(A,B)∈[0,1],满足:
(1)σ(A,A)=1,∀A,B ∈F(X),
(2)σ(A,B)=σ(B,A),∀A,B ∈F(X),
(3)A⊆B ⊆C ⇒σ(A,C)⊆σ(A,B)∧σ(B,C),
则称σ(A,B)为A 与B 的贴近度。
定义3 设A、B 是论域X 上的具有三种否定的模糊集IFScom,∀x∈X,映射
称N(A,B)为模糊集IFScom 上A 与B 的贴近度。
定义4[7]设A、B 是论域X 上的IFScom 模糊集,,映射
称为IFScom 模糊集A 与B 的格贴近度。
显然式(1)(2)均满足公理化定义2。实际应用中,可以根据具体情况来选择IFScom 贴近度或格贴近度计算。
车牌文字图像的点的密度与其周围点的位置和灰度值相关[8],通常文字像素点周围的像素点越多,则组成“文字”的可能性越大,反过来该像素点可能是“噪声”。以下给出一种基于像素点空间分布的密度函数,点密度函数定义如下:
定义5设X为文字像素集,xi,xj分别表示X 中像素点i,j 的灰度(灰度级为0-255,0 和255 分别表示该像素点为白色和黑色),则对于每个像素点xi,其点密度函数zi定义为:
式(3)中,0 ≤zi≤1,当zi=0 表示xi是黑或白的孤立点,zi=1 表示该点像素灰度级与周围点是相同的。把它当作点分布的模糊隶属度。
基于模糊集IFScom 贴近度的车牌文字模糊识别的原理如下:对给定的待识别对象集合U中的每个对象u,建立特性指标向量u=(u1,u2,…,up)。若识别对象集合u的n个类别均为u上的一个模糊集IFScom,记作A1,A2,…,Ap,模糊识别就是把对象u=(u1,u2,…,up)划归到与其最相似的一个类别Ai中(1≤i≤n)。建立模糊模式的隶属函数特征,计算出具有三种否定的IFScom模糊集的贴近度,按照最大贴近度原则判断对象u 归属于哪一个类别。算法的主要流程图如图1。
图1 模糊车牌识别算法流程图
通过计算比较模糊字符集与标准字符向量特征的贴近度,找到贴近度最大的输出类别。
为了方便,本次实验以常见的蓝底小车牌照为例(如图2):一般有七个字符,包括首位汉字及后面的6位字母或数字。建立了24 个汉字、26 个字母与10 个数字总共60 个标准字符的特征向量,其他车牌字符集的方法与此相同。
图2 待识别车牌图像
实验步骤如下:
(1)由于车牌文字的宽高比接近1:2,对所有标准车牌字符集Fi(i=1,2…60) 分割成8×4 方块点阵。
(2)对每个方块中像素点出现的清晰度利用式(3)计算其隶属度uij(i,j为所在的行列)。分别得到标准车牌文字A1(本例为字符F)与待识别模糊车牌文字A的向量特征关系矩阵如下:
图3 车牌字符的8×4分块
(3)字符像素集A 的对立否定A┑是完全不属于该字符集,而部分污损或不完全的模糊字符像素属于中介否定集,根据模糊集IFScom 定义,计算出A1的中介否定隶属度(中介否定参数λ=0.75):
同上方法计算待识别车牌字符像素集A的中介否定隶属度:
(4)将字符关系矩阵(8×4)按照行列展开成一维特征向量,根据式(1)分别计算标准字符集Ai(i=1,2,…60 )与待识别字符A 的贴近度N(Ai,A),结果N(A1,A)最大,因此待识别的字符是图3 中的字母F。
(5)重复执行以上步骤,可以得到完整的模糊车牌文字如图4。
图4 模糊车牌识别结果
为对比本文采用模糊集IFScom 具有三种否定贴近度方法的效果,选取标准和模糊车牌图片与文献[4]的主成分特征重建PCF 方法、文献[8]的格贴近度GCD方法作对比实验,得到表1 的准确率。
表1 车牌文字识别的准确率对比
从表1 可以看出对于标准清晰的车牌,三种算法的准确率为100%。对于模糊污损车牌文字的识别率本文方法有一定的提高,主要的原因是具有三种否定的贴近度充分考虑了污损文字的中介模糊信息。
本文给出了一种基于IFScom 贴近度的模糊图像文字识别方法。该方法通过建立文字像素点的分布隶属度来描述字符的特征指标,利用具有三种否定模糊集IFScom 贴近度包含中介否定来刻画污损图像的灰度模糊特征。通过理论和实验表明,该算法可用于解决实际车牌识别中的一些模糊或不完全文字问题,具有一定的实际意义。