基于多特征值的服装检测与识别算法

2016-12-06 10:25刘建平徐松松
实验室研究与探索 2016年5期
关键词:矩形框欧氏直方图

魏 芬, 刘建平, 徐松松, 曹 飞

(1. 南京航空航天大学 金城学院,江苏 南京 211156;2. 南京东大智能化系统有限公司,江苏 南京 210023;3. 南京邮电大学,江苏 南京 210006)



基于多特征值的服装检测与识别算法

魏 芬1, 刘建平2, 徐松松3, 曹 飞3

(1. 南京航空航天大学 金城学院,江苏 南京 211156;2. 南京东大智能化系统有限公司,江苏 南京 210023;3. 南京邮电大学,江苏 南京 210006)

提出一种基于多特征值的服装检测与识别算法。通过人脸检测辅以Canny算子边缘检测实现对服装的精确定位,采用颜色直方图加以最小欧氏距离的组合方式提取特征值,设计贝叶斯分类器,将特征值进行正、负样本分类,最终实现对服装的识别。实验表明,该算法能够有效检测与识别服装,达到预期效果。

服装识别; Canny算子; 颜色直方图; 最小欧氏距离; 贝叶斯分类器

0 引 言

移动互联网以及智能终端的发展,扫码技术在移动终端设备中的应用已日趋成熟,然而通过移动终端实现对服装的检测与识别技术还不成熟。本文借用移动终端扫码进行信息识别的思想,研究基于多特征值的服装检测与识别算法,应用于移动终端设备。本文从服装检测和服装识别两部分对算法进行分析研究。服装检测方面,首先通过AdaBoost[1-2]算法检测人脸区域,然后通过Canny算子[3]进行边缘检测,最后通过服装迭代定位算法实现对服装的精确定位;服装识别方面,基于服装检测,首先通过颜色直方图加以图像最小欧氏距离(MED)[4-5]提取特征值,然后设计并训练贝叶斯分类器[6-9],最后通过训练好的分类器实现对服装的高效识别。通过移动终端实现对服装的检测与识别必然需要对服装图片进行分析、检测、特征提取和识别的过程,本文是在VS2015开发环境下结合OpenCV视觉库模拟移动终端扫码实现对服装的检测与识别过程。实验结果表明,本文提出的算法能够有效检测与识别服装,达到预期结果。

1 服装检测

1.1 人脸检测

本文通过人脸检测对服装进行粗定位,然后结合下文中的迭代算法实现服装的精确定位。人脸检测技术已日趋成熟,有很多的人脸检测算法得到了很好的应用。采用AdaBoost 算法,在VS2015开发环境下应用OpenCV提供的函数和分类器对人脸进行精确检测。AdaBoost采用迭代的算法思想,通过不断的训练同一个训练集得到多个不同的弱分类器,然后再将这些弱分类器以加权投票的方式得到一个最终的强分类器。通过AdaBoost 算法实现分类器训练流程如图1所示。

图1 分类器训练流程图

VS2015开发环境中人脸检测程序由三个部分组成:加载分类器、加载待检测图像和检测与标识。在程序设计实现中,采用OpenCV库提供的haarcascade_frontalface_alt.xml文件存储的目标检测分类,图像载入使用函数cvLoad来完成,cvLoad函数载入图像后对图像进行强制类型转换,函数cvHaarDetectObjects检测图像中人脸目标,并标出人脸矩形框。

1.2 服装迭代定位算法

基于上文AdaBoost 算法得到人脸矩形框,通过多次试验和人体测量学理论确定人的上身与脸部的比例,将矩形框进行一定比例的移动、放大,矩形框的最优边的选定是包含Canny算子边缘检测的边缘点最多的边,实验发现这样的粗定位方式具有不稳定性。所以,本文进一步采用服装矩形框的上边与人脸矩形框的下边同高度的矩形框通过迭代算法实现服装的精确定位。

Canny边缘检测算法是边缘检测领域的经典算法,得到了很好的优化和应用,其高定位精度、抑制虚假边缘和低误码率等优点符合本文对算法设计与研究的要求,所以本文采用Canny算子作为服装边缘检测技术,并与服装迭代定位算法结合,实现服装的精确定位。

服装迭代定位的具体算法如下:

(1)设定人脸检测矩形框的参数。宽度为Wf,高度为Hf,垂直中心对称轴为L,水平对称轴为R,定义服装矩形框的上边框高度为人脸矩形框下边高度。

(2)设定服装矩形框选取的终止条件。服装矩形框的宽度最大不得超过人脸矩形框宽度的3倍,假设服装矩形框以垂直中心轴L为对称轴,所以,服装矩形框的左边框最大宽度Wl=1.5Wf,服装矩形框右边框最大宽度Wr=1.5Wf,下边框到上边框的最大距离不超过Hd=3.5Hf。设置放大次数n=6,根据终止条件和放大次数计算出每次放大每条边的步长因子nL=Wl/6,nR=Wr/6,nD=Hd/6。

(3)对称轴L。依据步骤(2)中的步长向左移动,两两比较对称轴包含边缘点的多少,保留较多的对称轴继续与下一个对称轴比较,当对称轴移动过程中满足步骤(2)中的终止条件时,比较对称轴包含边缘点情况,选取包含边缘点最多的对称轴作为服装矩形框的左边框。

(4)服装矩形框的右边的选取。方式与步骤(3)同理,对称轴L依次向右移动,满足终止条件时,最终选取包含边缘点最多的对称轴作为服装矩形框的右边框。

(5)服装矩形框的下边框的选取。方式与步骤(3)同理,对称轴R依次向下移动,满足终止条件时,最终选取包含边缘点最多的对称轴作为服装矩形框的下边框。

(6)矩形框。根据以上的迭代算法选择出最优的左右边框以及下边框,并根据最终选取的边框确定服装的精确位置,并在原图像中画出服装矩形框。

通过以上算法实现对服装的精确定位,完成对服装的检测部分。

2 服装识别

2.1 颜色直方图

颜色是图像中重要的特征元素,由于颜色对图像的尺寸、视角和方向的依赖性较小,因此具有较高的鲁棒性,在图像相似度计算中得到大量应用。颜色表征图像的特征通过颜色直方图[10]来反映,并得到很好用的研究与应用,通过颜色直方图来描述图像颜色特征在颜色空间中的概率分布,即反映不同色彩在整幅图像中所占的比例。对每种颜色在图像中的像素数进行统计并构造的归一化颜色直方图,具有尺度不变性和旋转不变性的特性。

一般的图像都是采用RGB空间进行表示的,但RGB颜色空间与人眼的视觉感受不同,通常需要将RGB空间转换为其他空间。HSV空间是一种基于感知的颜色模型,能够更准确地感知颜色间的信息,由H、S和V三个分量组成,其中H表示色度、S表示饱和度、V表示亮度[11]。所以,通过颜色直方图进行图像识别时就需要先进行颜色空间的转换。由上所述,通过颜色直方图对图像相似度进行匹配需要以下几步:首先将RGB空间转换为HSV空间[12];其次适当量化转换后的HSV空间图像并构造出归一化颜色直方图;最后通过构造的归一化[13]颜色直方图的匹配计算,得到图像的相似度。

通过对颜色空间的分析,把三个分量进行量化,分别将色调H空间分为6份,饱和度S空间分为4份,亮度V空间分为3份。量化后的结果如下所示:

通过以上的量化结果将HSV空间分成LH×LS×LV个代表色空间,其中,LH、LS和LV分别表示H、S和V的量化级数(LH=6,LS=4,LV=3),也就是将颜色空间分成72个代表色空间。按照以上量化级数,把3个颜色分量合成为一维特征矢量I=H×LH+S×LS+V×LV,即G=6H+4S+3V。G的取值范围为G∈[0,1,2,…,71],计算G就得到一维直方图。

假设原始图像I,其直方图特征向量Hi=(i0,i1,…,iL),图像库中待检图像Q,其直方图特征向量HQ=(q0,q1,…,qL),利用下面的公式计算相似度:

(1)

2.2 最小欧氏距离

将M×N维的图像进行灰度值处理,转换到MN维欧氏空间,这样的欧氏空间称为图像空间RMN。在图像空间坐标系中,基坐标用e1,e2,…,eM×N表示,其中,坐标ekN+l与原图像坐标系中的坐标(k,l)相对应,即ekN+l表示原图像坐标系中坐标(k,l)的灰度值,设一幅图像量化后用X=(x1,x2,…,xMN)来表示,那么,两幅向量化后的图像X和Y的欧氏距离为:

(2)

根据式(2)对数据库中的三幅图像计算两两间的欧氏距离,计算结果表明相似的两幅图像的欧氏距离反而大于不相似的两幅图像,经分析发现导致这种错误的原因在于只用各坐标的灰度值对图像进行描述,而忽略了个坐标点间的空间关系。

基于以上的分析,本文给出了最小欧氏距离(MED)的计算推导。定义坐标度量系数gij(其中,i,j=1,2,…,MN),表示坐标xi对坐标yj的作用,将gij引入到欧氏距离计算公式,如式(3)所示:

(3)

其中,对称矩阵G=(gijMN×MN)称为度量矩阵。由式(3)可知,公式中的主要约束条件就是度量系数gij,它依赖于xi和yj之间的坐标距离,如下式所示:

(4)

根据最小欧氏距离原理,式(4)满足当|xi-yj|递增时,gij单调递减,为了保证G正定,函数f必须是连续正定函数,分析式(3)发现,由于需要存储MN×MN维的矩阵G,所以其计算并不是很高效的。因此,把式(3)中的矩阵G分解为ATA,如下式所示:

(5)

其中,U=AX,V=AY,可见,只要求得A,式(5)则可以转化为式(2)。

可以将矩阵G进行如下分解:

(6)

用克罗内克尔积和高斯函数求解矩阵G,如下式所示:

(7)

假设图中两点(mi,ni)、(mj,nj)的坐标分别用xi和yj表示,则图中两坐标点的相应平方距离的计算公式如下式所示:

(8)

把式(8)带入式(7),并且进行化简,可以得到:

(9)

如前所述,m∈[1,M],n∈[1,N],这样就分别重新生成了一个M×M的矩阵ΨM和一个N×N的矩阵ΨN,具体可表示为:

(10)

(11)

则G可以写成ΨM和ΨN的克罗内克尔积:

(12)

再将Ψ分解成相应的特征向量和特征值的表示形式,即

(13)

则G可以表示为:

G=(ΩΘΩT)⊗(ΩΘΩT)=

(Ω⊗Ω)(Θ⊗Θ)(Ω⊗Ω)T=ΓΛΓ

(14)

通过以上的分析推导,给出的最小欧氏距离考虑了灰度值以及坐标点间的空间关系,可以更好地表征图像。通过最小欧氏距离保证了相似图像欧氏距离值小,通过比较欧氏距离值实现对图像的识别,为下文中的贝叶斯分类器提供更加精确的特征值。

2.3 贝叶斯分类器

贝叶斯分类器以贝叶斯公式作为其坚实的数学理论,并能够综合先验信息和数据样本,对未知图像类型进行预测[14]。目前研究较多的贝叶斯分类器主要有四种:Naive Bayes、TAN、BAN、GBN,本文对Naive Bayes进行研究和应用,实现图像特征值的分类以及服装的识别。

Naive Bayes分类器是基于独立假设的,即假设样本的每个特征值与其他特征值都不相关。设变量集U={A1,A2,…,An,C},其中,A1,A2,…,An表示对象的各个属性变量,C表示取m个值的类变量,这样就得到Naive Bayes分类器(假设属性Ai都条件独立于C),Naive Bayes分类器工作过程如下:

设n维特征向量X={x1,x2,…,xn}表示未分类数据样本即未知样本,对应A1,A2,…,An属性值,设有m个类用C={C1,C2,…,Cm}表示,Naive Bayes分类器将未知样本X分配给类C,当且仅当P(Ci|X)>P(Cj|X),1≤i,j≤m,j≠i,最大化P(Ci|X),其中,P(Ci|X)最大的类Ci为最大后验假设[15],根据贝叶斯定理:

(15)

其中,P(X)对于所有类为常数,由于类的先验概率未知,所以设定P(C1),P(C2),…,P(Cn)为等概率的,为化简计算可以做类条件独立的假定,即各属性间不存在依赖关系,则

(16)

概率P(x1|Ci),P(x2|Ci),…,P(xn|Ci)可以从训练样本估计值得到。

(17)

其中,Sik是在属性Ak上具有值xk的类Ci的训练样本数;Si是Ci中的样本数。

3 实验及结论

基于以上各研究点的研究及相关算法的改进,设计服装检测与识别系统,算法流程图如图2所示。

图2 服装检测与识别算法流程图

本实验中选取服装样本数为498,共有23种品牌,通过本文给出的算法,首先由AdaBoost算法对图像进行人脸检测并画出人脸矩形框;然后通过Canny算子对图像进行边缘检测,结合服装定位算法,实现对服装的精确定位并画出服装矩形框;其次,对服装矩形框部分进行直方图转换,通过MED计算特征值;最后根据提取的特征值训练贝叶斯分类器,实现对服装的识别。

图3所示为一组通过本文算法处理后得到的服装精确定位结果图。由图3可知,本文给出的服装检测算法能够实现对服装的精确定位。

图3 服装精确定位图

服装精确定位后,通过颜色直方图和MED计算特征值,对每一幅服装图像提取48个特征值,构建测试样本:Mat testSample(1, 48, CV_32FC1),构建训练样本:Mat trainData(498, 48, CV_32FC1),对测试样本进行测试:testNbc.predict(testSample)。实验中随机选取一张图像进行测试,能够正确输出服装品牌,测试结果正确。

4 结 语

以上的实验对本文提出的服装检测与识别算法的可行性进行了验证,达到预期效果。本文研究的出发点是实现移动终端设备对服装的检测与识别,因此下一步工作重点是将算法移植到移动终端设备,通过终端设备实现对服装的检测与识别。

[1] An T,Kim M.A new diverse AdaBoost classifier[J].//International Conference on Artificial Intelligence & Computational Intelligence,2010(1):359-363.

[2] Wu S,Nagahashi H.Parameterized AdaBoost: introducing a parameter to speed up the training of real AdaBoost[J].IEEE Signal Processing Letters,2014,21(6):687-691.

[3] 赵 岩,周百灵,陈贺新.一种改进的基于Canny算子边缘检测算法.吉林大学学报(理学版)[J],2012,50(4):740-744.

[4] Schouten T E,van den Broek E L.Fast exact euclidean eistance (FEED): anew class of adaptable distance transforms[J].IEEE Trans Pattern Anal Mach Intell,2014,36(11):2159-2172.

[5] 戴 欢,吴小俊.基于图像欧氏距离的人脸描述和识别方法[J].江南大学学报(自然科学版),2009,8(1):20-23.

[6] 代 磊,马卫东,王凌楠,等.基于权重的朴素贝叶斯分类器设计与实现[J].情报理论与实践,2008;31(3):440-442.

[7] 蒋良孝.朴素贝叶斯分类器及其改进算法研究[D].武汉:中国地质大学,2009:5-8.

[8] Lv H S X.The naive bayesian classifier learning algorithm based on adaboost and parameter expectations[J].Computational Science & Optimization Ird International Joint Conference on,2010:377-381.

[9] Yang Y, Shi Y.An algorithm for incremental tree-augmented naive bayesian classifier learning[C]//International Conference on Artificial Intelligence & Computational Intelligence.IEEE,2010:524-527.

[10] 陈 晨.基于颜色直方图的图像检索[J].哈尔滨师范大学自然科学学报,2014,30(2):31-35.

[11] 侯阿临,赵柳青,桃 敏,等.基于多特征的服装图像检索[J].现代电子技术,2010,33(6):171-175.

[12] 卢兴敬.基于内容的服装图像检索技术研究及实现[D].哈尔滨:哈尔滨工业大学,2008.

[13] 李贵俊,刘正熙,游志胜,等.一种基于色差和彩色归一化的车身颜色识别算法[J].计算机应用,2004,24(9):47-49.

[14] 付 丽,孙红帆,杨 勇,等.基于贝叶斯分类器的图像分类技术[J].长春理工大学学报(自然科学版),2009,32(1):132-134.

[15] 邸 鹏,段利国.一种新型朴素贝叶斯文本分类算法[J].数据采集与处理,2014,29(1):71-75.

Research on Clothing Detection and Recognition Algorithm Based on Characteristic Values

WEIFen1,LIUJian-ping2,XUSong-song3,CaoFei3

(1. College of Jincheng,Nanjing University of Aeronautics and Astronautics,Nanjing 211156, China; 2. Nanjing SEU Intelligent System Co. Ltd,Nanjing 210023,China; 3. Nanjing University of Posts and Telecommunications,Nanjing 210006, China)

Clothing recognition is a research focus in the field of image recognition. This paper studies the clothing detection and recognition technology on the basis of previous studies, and proposes a multi-feature detection and recognition algorithm. Through the face detection combined with Canny edge detection, it achieves precise positioning of clothing, then the characteristic value is extracted by color histogram and minimum Euclidean distance. At the end, design the Bayesian classifier is used to classify the characteristic values into positive and negative samples to identify the clothing. Experiments show that the algorithm can effectively identify the clothing and achieve the desired results.

clothing recognition; Canny operator; color histogram; MED; Bayesian classifier

2015-10-13

国家自然科学基金项目(61203246)

魏 芬(1978-),女,江苏南京人,硕士,讲师,主要研究方向为电子信息通信、嵌入式系统设计。

Tel.:13390753998,025-87190127;E-mail:wfen1229@126.com

TP 391.4

A

1006-7167(2016)05-0118-05

猜你喜欢
矩形框欧氏直方图
符合差分隐私的流数据统计直方图发布
本刊2022年第62卷第2期勘误表
多模态卷积神经网络的物体抓取检测
一种汽车式起重机防倾翻方法的研究
用直方图控制画面影调
共享单车有了“家”
中考频数分布直方图题型展示
基于空间变换和直方图均衡的彩色图像增强方法
基于多维欧氏空间相似度的激光点云分割方法
基于可变矩形框的人群密度估计算法