基于深度学习的交通标志识别

2023-04-28 01:30辛靖宇徐伟昊赵子亮朱庆林
北京汽车 2023年2期
关键词:交通标志图像识别直方图

辛靖宇,徐伟昊,赵子亮,郭 斌,朱庆林

基于深度学习的交通标志识别

辛靖宇,徐伟昊,赵子亮,郭斌,朱庆林

Xin Jingyu,Xu Weihao,Zhao Ziliang,Guo bin,Zhu Qinglin

(山东科技大学交通学院,山东青岛266590)

图像识别技术是无人驾驶实现的关键,交通标志识别是图象识别的重要研究方向。选用MATLAB的AlexNet深度神经网络模型,通过迁移学习对交通路标数据集进行训练,将训练结果与传统的局部二值模式和方向梯度直方图进行对比,得到AlexNet模型的交通路标识别准确度为98.79%,后两者分别为86.3%、97.6%,AlexNet模型更优。

图像识别;深度学习;机器学习;深度神经网络模型

0 引言

交通道路标志识别在辅助驾驶和无人驾驶技术中发挥着重要作用。无人驾驶仍须遵守交通法规,而交通标志是交通法规的直接体现,如何准确快速地识别交通标志对于提高无人驾驶的安全性和合法性具有重要作用。

交通标志的图像识别本质上是一种分类问题,当前所用的传统方法主要有最近领域法、决策树分类法、人工神经网络、支持向量机[1-3],每种方法各具优势,但各自缺点也明显。最近邻域法花费时间较长、实时性差;决策树分类法识别速度快,但误识率相对较高;人工神经网络的抗干扰能力差、结果不稳定;支持向量机所提取的图像特征点较多,准确率较高,但识别时间长、速度慢[4-6]。

本文在上述方法的基础上,考虑现实应用场景中对于交通标志图像识别准确率和识别速率的要求,提出基于深度学习算法的交通标志图像智能识别方法,在常规深度学习的识别模型基础上进行迁移学习,并分别与传统机器学习的局部二值模式和方向梯度直方图特征提取算法进行仿真对照测试,结果显示所提出的方法在识别准确率、识别速率方面较后两者均有较明显提升,满足图像识别现实场景的应用要求,缩短识别时间,可实现实时识别。

1 模型选取

1.1 模型介绍

AlexNet为ImageNet 2012图像识别挑战赛冠军,其网络结构为8层:5层卷积层、2个全连接隐藏层和1个全连接输出层,其使用网络激活函数ReLU(Rectified Linear Unit,修正线性单元)使神经网络更好地解决复杂的非线性问题,并在池化层之后添加LRN(Local Response Normalization,局部响应归一化层),在隐藏全连接层前加入Dropout层,以此提高整个网络的泛化能力[7]。该模型具有双GPU(Graphics Processing Unit,图形处理器)并行计算、LRN标准化层、重叠池化、ReLu激活函数、Dropout、数据增强等技术特点。

综上,本文选用AlexNet对数据集进行训练,并与LBP(Local Binary Patterns,局部二值模式)、HOG(Histogram of Oriented Gradient,方向梯度直方图)进行准确率对比。

1.2 迁移学习模型的改进

对AlexNet模型进行迁移学习,删除其最后一个全连接层,将其余部分作为数据集的固定特征提取器,保留前5个卷积层和相应池化层以及3个全连接的参数,其他参数采用随机初始化,最后一层为用于分类的Softmax层,其原理如图1所示,利用所提取的特征训练一个分类器实现模型迁移[8],其神经元个数为被分类任务数据集的图像类别数量。

图1 Softmax层工作原理

2 模型训练与对比

2.1 数据选取

我国交通标志数量较多,为符合现实生活场景的识别条件以及满足模型训练对于图像模糊度、光照条件变化的要求,所选用的交通标志数据集为Chinese Traffic Sign Database,其中共包括6 164幅交通标志图像和58个标志类别,部分图像如图2所示。图像分为训练数据库和测试数据库两个子数据库。训练数据库包括4 170幅图像,测试数据库包括1 994幅图像。从训练数据库和测试数据库中共挑选2 199幅图像和30个交通标志类别,具体类别及代号见表1。

图2 交通标志图像选取示例

表1 交通标志类别及代号

2.2 基于迁移学习的AlexNet模型

模型训练时采用分批输入方式,每次输入10幅交通标志图像。训练模型的参数设置采用SGDM(Stochastic Gradient Descent with Momentum,动量随机梯度下降)优化器,初始学习效率为0.000 1,进行3轮学习,每轮迭代219次,共计迭代657次,同时每进行两次迭代后进行一次验证,并将每一次的测试数据作为下次的训练数据。

AlexNet模型识别交通标志的迭代准确率曲线如图3所示,曲线在迭代0~70次处斜率最大,即准确率增长最快;曲线在迭代70~180次处斜率逐渐减小,模型准确率缓慢上升;曲线在迭代180次后出现波动变化,最终迭代准确率为98.79%。

图3 准确率-迭代次数曲线

AlexNet模型的识别损失率趋势线如图4所示,总体为减小趋势,并且随着迭代次数增加趋于收敛。在迭代0~70次处损失曲线下降速度最快,后续迭代中,下降速度有所减缓,损失率最终收敛于1.21%。

图4 损失率-迭代次数曲线

通过迁移学习对AlexNet模型自带的物体识别类型进行改进,将原来识别1 000种物体改进为识别上文所述30种交通标志。改进后对于交通标志识别的准确率为98.79%,损失率只有1.21%,模型计算速度也有提升,用时17 min 完成了3轮周期共计657次迭代。

2.3 LBP

LBP是一种针对灰度图像进行局部纹理特征提取的描述算子,以×窗口或圆形窗口的中心像素为阈值,与窗口范围中的其他部分进行比较得出特征值,原理如图5所示,在半径为1、2的圆型区域中分别分布8个、12个采样点。

由于LBP算子具有旋转不变性,所以LBP模型具有旋转不变性和灰度不变性,另外,LBP算法计算速度较快,所需的灰度值可以通过在图5窗口的小邻域内进行比较得到,使得在复杂的实时条件下分析图像成为可能[9]。由于LBP算子具有灰度不变性,则将图像旋转后,再进行灰度化处理,发现无论正方形区域还是圆形区域,采用LBP算子采集周围区域数值,之后进行旋转,将最小值作为最终结果,其与旋转照片所得结果相同,所以LBP对于方向并不敏感。所采用的灰度图对光照有一定要求,若光照不均匀则不能正确反映图像特征。

图5 LBP原理

LBP算法关于KNN (K-Nearest Neighbor,最邻近分类)模型对给出的2 199张交通标志的识别正确率为86.3%,此过程平均用时43 min。由图6(a)ROC(Receiver Operating Characteristic Curve,接收者操作特性曲线)可知,当前KNN模型的假正率为0%,真正率为70%;由图6(b)混淆矩阵可知,正确率100%的类别有12、17、20、29、30。

图6 基于LBP的KNN模型训练结果

2.4 HOG

HOG也是对于局部纹理特征提取的算法,首先将图像进行灰度化处理,并将周围划分为区域像素进行梯度数值求解,得到局部归一化的梯度方向直方图,并据此构成特征[10]。HOG将统计得到的图像局部区域的梯度方向信息作为该局部图像区域的表征。

如图7所示,Block为检测目标画面中的一个滑框;Cell为Block的下级,是用于分割画面的窗口,且不可移动;HOG Bins表示直方图区间。将整个图片划分为若干Cell,避免因有效值稀疏而带来运算量大和受噪声干扰的问题。另一方面,HOG在计算梯度前会对图像进行归一化处理,其对于图像的几何、光学形变均具有较为优秀的不变性。

图7 HOG原理

图8 基于HOG的KNN模型训练结果

但由于HOG所采集的特征维度较多,所以采集的数据量大,数据处理难度较大,运算速度较慢、实时性较差,通常与降维方法搭配使用;另一方面,HOG难以处理遮挡问题,并且当人体动作或物体方向改变幅度过大时也不易检测出来。

HOG算法关于KNN模型对给出的2 199张交通标志的识别正确率为97.6%,此过程平均用时20 min。由图8(a)ROC可知,当前KNN模型的假正率为0%,真正率为96%;由图8(b)混淆矩阵可知,正确率100%的类别有3、7、8、9、11、12、13、14、17、19、20、24、26、30。HOG对交通标志识别的正确率较LBP有明显提高。

通过以上对比分析可以发现,改进的AlexNet模型相较HOG算法与LBP算法的KNN模型,不论在交通标志识别准确率方面还是交通标志识别效率方面均有提升,深度学习模型AlexNet相比LBP及HOG机器学习算法具有较大优势。

3 结束语

随着深度学习模型的不断发展,在今后交通标志识别相关研究中,可以重点关注模型轻量化和便捷性,进一步提高模型识别的精度和速度,增强识别的稳定性。

[1]董娜,刘欣宇,吴爱国. 基于人工蜂群的新型圆形交通标志识别算法[J]. 天津大学学报(自然科学与工程技术版),2019,52(6):585-593.

[2]张兴国,刘晓磊,李靖. BP神经网络下的限速交通标志实时检测识别[J]. 西安电子科技大学学报,2018,45(5):136-142.

[3]甘露,田丽华,李晨. 基于融合特征和BP网络的交通标志识别方法[J]. 计算机工程与设计,2017,38(10):2783-2787,2813.

[4]徐岩,王权威,韦镇余. 一种融合加权ELM和AdaBoost的交通标志识别算法[J]. 小型微型计算机系统,2017,38(9):2028-2032.

[5]刘亚辰,陈跃鹏,张赛硕. 融合式空间塔式算子和HIK-SVM的交通标志识别研究[J]. 交通运输系统工程与信息,2017,17(1):220-226.

[6]李春祥,张浩怡. 基于混合多变量经验模态分解和极限学习机的非平稳过程预测[J]. 上海交通大学学报,2020,54(4):376-386.

[7]李钦岩,孙鹏,韩虹. 基于改进的AlexNet的车辆颜色识别[J]. 警察技术,2021(4):57-60.

[8]许益乔,杨虹,张占月. 一种基于AlexNet迁移学习模型的空间目标ISAR像识别方法[J]. 兵器装备工程学报,2022,43(5):210-219.

[9]魏祥坡,余旭初,张鹏强. 联合局部二值模式的CNN高光谱图像分类[J]. 遥感学报,2020,24(8):1000-1009.

[10]宋思蒙,钱勇,王辉. 基于方向梯度直方图属性空间的局部放电模式识别改进算法[J]. 电工技术学报,2021,36(10):2153-2160.

2022-10-24

1002-4581(2023)02-0035-04

U463.67+4

A

10.14175/j.issn.1002-4581.2023.02.009

猜你喜欢
交通标志图像识别直方图
符合差分隐私的流数据统计直方图发布
基于双向特征融合的交通标志识别
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
用直方图控制画面影调
图像识别在物联网上的应用
图像识别在水质检测中的应用
交通标志小课堂
基于空间变换和直方图均衡的彩色图像增强方法
基于直方图平移和互补嵌入的可逆水印方案