一种改进的交通标志检测方法

2019-04-08 00:46黄尚安董超俊林庚华甄俊杰
现代计算机 2019年6期
关键词:交通标志卷积图像

黄尚安,董超俊,林庚华,甄俊杰

(五邑大学智能制造学部,江门 529020)

0 引言

近年来,交通标志识别技术(TSR)越来越受到关注,因为这是驾驶员辅助系统(ADAS)和自动驾驶汽车领域的一个关键技术。在真实的自然场景下,交通标志识别的传统方法会面临许多艰难的挑战,并且交通标志的正确识别直接影响到车辆的安全驾驶,这都对我们的研究提出了更加严格的要求。

本文侧重于研究交通标志的检测算法,现有的关于交通标志检测的算法可以大致分为三类:①Violajones的方法[2];②基于颜色和形状模型的方法[3];③基于梯度方向直方图(HOG)和支持向量机(SVM)的方法[4];④基于CNN卷积神经网络的方法。

Viola-jones使用AdaBoost算法训练一系列二进制线性分类器,然后在测试图像中执行滑动窗口对交通标志进行检测,对分类器具有最高响应的窗口位置被视为检测到的标志位置;对基于模型的方法,其首先使用颜色和形状特征来检测图像中的边缘,然后将边缘连接起来形成规则的多边形或者圆形,通过霍夫圆变换来进行模板匹配;基于方向梯度直方图(HOG)的方法,从图像单元中提取产生高性能的HOG特征,然后在多个单元上集合成块,在这些HOG特征上使用线性或非线性分类器作为检测器进行训练,最后得到检测结果。对于CNN的方法即是建立卷积神经网络的结构,通过训练网络,最后能够使网络获得检测交通标志的能力。

对于前面三种传统方法来讲,算法复杂度高;检测使用的数据集较为专一;检测精度受天气等自然场景的影响较大。故本文选择第四种基于CNN卷积神经网路的方法来研究交通标志的检测问题,CNN是当下最流行的图像检测和分类的方法。CNN对于目标检测的方法大致分为两类:第一类是基于区域推荐的目标检测算法,以 R-CNN[5]、Fast R-CNN[6]、Faster R-CNN[7]算法为代表;第二类是基于回归的目标检测算法,以YOLO[1]、SSD[8]算法为代表。对于第一类基于区域推荐的算法,其首先预选出推荐区域,即找出感兴趣区域再来做特征提取。其算法拥有较高的检测精度,但是处理速度太慢;对于第二类基于回归的算法,其建立默认框、真实标签框、预测框之间的关系进行训练。其算法实时性好,检测精度高,但是对于交通标志这样小目标检测的结果却不甚满意。

本文选择研究基于YOLO模型的交通标志检测问题,研究目标即是提高YOLO模型对交通标志这样小目标的检测精度,并且希望本文改进的方法对其他小目标的检测都能有一定的借鉴作用。

1 方法设计

首先介绍一下原YOLO[1]模型:YOLO模型采用一个单独的CNN模型实现端到端的目标检测,其首先将输入图片调整到448×448,然后送入CNN网络,最后处理网络预测结果得到检测的目标。相比R-CNN算法,YOLO是一个统一的框架,其速度更快,而且YOLO的训练过程也是端到端的。YOLO采用卷积网络来提取特征,然后使用全连接层来得到预测值。网络结构包含24个卷积层和2个全连接层,对于卷积层,其主要使用1×1的卷积来做减少通道数的运算,然后再紧跟3×3的卷积,网络结构如图1所示。

在一幅含有交通标志的图像中,与图像中其他物体例如汽车、行人、建筑物等相比,交通标志相对较小。为了更加准确的检测交通标志,本文提出了一种特征转移连接(Feature Transfer Connection)的方法来改进原YOLO模型。特征转移连接(FTC)的核心思想是将卷积神经网络结构中高层和低层的特征进行有效的聚合,可以聚合来自不同的多尺度特征,所提方法的框架如图2所示。

如图2所示,黑色框表示YOLO模型的原始架构,蓝色框表示提出的特征转移链接(FTC)的方法。该模型在每次下采样操作(C1-C5)之后应用FTC的方法以收集聚合不同比例级别的特征。

图2

FTC是一种特殊的卷积层,对图1中所示的每一个FTC卷积层来说,其卷积核的大小、步长都是不一样的。接下来详细说明FTC卷积层的计算公式:在FTC的卷积层中,用“a×a”表示FTC卷积层的卷积核大小,“b”表示FTC卷积层的通道数,“d”表示FTC卷积层的步长。FTC卷积层相关系数的计算公式如下所述:

上述式中m和n是FTC卷积层输入特征图的宽度和高度,o和p是C6卷积块输出特征图的宽度和高度,c是C6卷积块输出特征图的通道数。在FTC卷积层的操作之后,我们通过使用元素求和的方法来聚合空间信息,将多尺度的特征聚合为C7的输入,如下所述:

图1

上述式中 fx表示卷积层C7的输入特征,Σ和⊕表示元素加法的求和,fCY表示CY的输出特征,Y表示卷积块的级别。

2 实验结果

2.1 实验细节

在我们的实验中,YOLO网络模型中的损失函数和所有参数(即每层中的内核数量,每个图像中单元格的大小还有激活函数等)都设置为默认值,如YOLO模型的原始工作[1]。本文提出的模型和YOLO模型都在公共交通标志数据集MASTIF[10]上进行训练和评估,MASTIF数据集包括:TS2009、TS2010和 TS2011。我们在具有 Intel Core i7-7700k CPU,16 GB RAM和NVIDIA GeForce GTX1080 GPU的计算机上做实验。

2.2 评估结果

如图3所示,所提出的方法可以很好地检测不同尺寸、角度和位置的交通标志。特别是对于较小的交通标志,相对于原模型,改进的YOLO模型能够很好地将交通标志检测出来,较好的解决了原YOLO模型对交通标志这样小目标漏检的问题。改进的模型和原模型的具体数据比较如表1所示。

图3 左:原YOLO模型,右:改进的YOLO模型

表1 原模型和改进YOLO模型的精确度对比

3 结语

在本文中,我们提出了一种针对交通标志检测的多尺度特征聚合和空间传播的网络模型。我们的实验表明,所提出的方法优于原网络模型,并对小交通标志的检测获得了令人满意的效果。所提出的特征转移连接确实提高了模型对不同尺寸目标对象的检测性能。在未来,希望我们的方法可以对更广泛的对象和数据集进行更深层次的研究。

猜你喜欢
交通标志卷积图像
基于全卷积神经网络的猪背膘厚快速准确测定
基于双向特征融合的交通标志识别
基于生成对抗网络的CT图像生成
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
浅析p-V图像中的两个疑难问题
巧用图像中的点、线、面解题
交通标志小课堂
我们欢迎你!