基于改进AI-YOLO v4算法的施工现场安全预警技术研究

2023-10-20 11:30钟源建刘添荣李卓亮
粘接 2023年10期
关键词:候选框安全帽置信度

钟源建,刘添荣,李卓亮

(广州电力工程监理有限公司,广东 广州 510660)

企业施工具有行业危险性与建筑工业复杂性的特点,这使得施工现场危险程度高,佩戴安全帽能够有效降低安全事故的发生,而单纯依赖于安全巡视员现场巡视和开展安全教育培训是远远不够的[1]。采用AI技术对施工现场实施安全监控,能有效提高工作效率。对安全帽检测在天气、光照强度等外界因素影响下出现的准确度低、漏检率大、错检率高问题,在YOLO-ST中引入密集空间金字塔池化模块,有效丰富了获取目标中的细节信息,大大提高了检测准确率[2]。结合安全帽数据集的目标尺度偏小、尺度分布不均衡问题,对SSD模型结构实施改进,添加了实施特征融合的分支网络,使得安全帽佩戴检测的准确率大大提升[3]。在传统YOLO v4网络中加入注意力机制模块来对安全帽特征进行聚焦,对YOLO v4网络进行改进,并与视频监控相结合,提出了安全帽佩戴检测模型,该模型对识别率为42帧/s,能够有效满足检测的实时性要求[4]。采用AI算法对施工现场安全帽佩戴不合规实施预警,对降低员工安全事故具有一定的实际意义。

1 YOLO v4原理

YOLO算法是AI在目标检测领域的重要算法。YOLO能够在一次前向传递中直接预测目标位置与类别,具有比较高的检测效率。YOLO v4作为YOLO系列的第4个版本,是基于深度学习的物体检测算法,其采用卷积神经网络端到端的检测模型,通过多尺度特征与多层次特征融合来检测物体,大大提升了物体检测的精度和效率[5]。传统网络所采用的激活函数往往不能够对物体图像的梯度信息进行有效保留,造成物体检测准确率不高。YOLO v4采用的是Mish激活函数,其数学表达式为[6]

(1)

Mish激活函数有上界无下界,避免了在网络训练过程中存在的梯度饱和问题,同时函数为非单调函数,稳定了网络梯度流。Mish激活函数还具有无穷阶连续性与光滑性,这使得网络具有比较好的泛化能力。YOLO v4采用Mish激活函数使得检测物体图像的梯度信息得到保留,具有更好的平滑非线性特征,大大提升了模型的训练学习能力。YOLO v4采用CSPDarknet53骨干网络,具有比较高的精度和效率,其网络结构如图1所示[7]。

图1 YOLO v4网络结构

(1)输入层:接受输入的图像数据;

(2)Convolutional Layers:一系列的卷积层用于提取图像的特征。CSPDarknet53使用多个卷积层来实现不同尺度的特征提取[8];

(3)CSP Blocks:CSPDarknet53引入了CSP Block作为主要的特征提取模块。CSP Block的设计采用了部分连接的思想,将输入特征分成2个部分:其中一部分经过一系列的卷积操作;另一部分直接进行跨阶段连接。通过这种设计,CSP Block能够充分利用浅层和深层特征的信息,提高特征的表达能力;

(4)Residual Connections:CSPDarknet53在网络中引入了残差连接,将前一层的特征直接与后续层的特征相加,有助于信息的传递和梯度的流动;

(5)Downsample Layers:通过下采样操作(如池化或卷积步长调整)来减小特征图的尺寸,提取更高级别的特征[9];

(6)Upsample Layers:通过上采样操作(如反卷积)来增加特征图的尺寸,恢复较低级别的特征;

(7)最终特征层:网络的最后一层输出最终的特征图,用于目标检测和定位。

2 改进YOLO v4模型

YOLO v4在进行目标检测是具有显著的优势,但是对存在大量重叠或者密集目标时,其可能会出现目标漏检或者重复检测的问题,这使得传统的YOLO v4在处理大量重叠或密集目标时面临巨大的挑战[10]。另外,YOLO v4采用单个边框来预测目标的位置与大小,这使得在处理复杂形状或模糊边界目标时往往存在边界框和目标之间存在比较大的偏差。YOLO v4的缺陷使得其在施工现场安全帽检测的过程中精度不高,需要进行模型的改进。

2.1 特定层插入注意力模块

为了有效解决传统YOLO v4模型对小目标、遮挡目标以及复杂背景下目标检测精度低的问题,引入SENet(Squeeze-and-Excitation Network)注意力机制,通过学习通道间的依赖关系来自适应地调整特征图的通道权重[11]。SENet主要包括Squeeze操作、Excitation操作以及Scale操作。Squeeze操作,即特征压缩操作,用来降低输入特征图的维度,达到减少模型计算复杂度的目的。通过Squeeze操作提取全局统计信息,捕捉通道间的相关性,其数学表达式为:

(2)

Excitation操作是通过一系列全连接层或卷积层来学习通道间的依赖关系,并生成一个通道权重向量,通过激活函数和非线性变换来建模通道之间的相互关系。Scale操作是将通道权重向量乘以原始的特征图,以加权增强特征图中的每个通道。通过自适应地调整通道的权重,重要特征得到了更多的关注,而不重要的特征则被抑制[12]。图2为SENet模块。

图2 SENet模块

2.2 边界框回归损失函数

边界框回归损失函数是目标检测任务中用于度量预测边界框与真实边界框之间差异的损失函数,常常采用交并比(IoU),其数学表达式为[13]:

(3)

式中:A为真实标定框;B为预测候选框。

很明显,如果A∩B=∅,那么交并比为0,无法进行网络训练[14]。结合前人的研究成果,对其进行改进,定义边界框回归损失函数(GIOU)为:

(4)

式中:C为包含A和B的最小框。

很明显所定义的边界框回归损失函数没有考虑真实标定框和预测候选框中心的距离,对其进行修正,提出新的边界框回归损失函数,即:

(5)

式中:b、bgt分别为预测框与真实框的中心点;ρ(b,bgt)为预测框与真实框中心点欧氏距离;c为预测框与真实框相交矩形区域对角线长度;ωgt、ω分别为真实框、预测框的宽度;hgt、h分别为真实框、预测框的高度。

2.3 学习策略

采用多候选框学习策略,即在初始的待检测目标候选框基础上,通过整合目标的位置信息和分类置信度信息来优化候选框的位置和分类置信度。在多候选框学习策略迭代的过程中不断地优化损失函数,并优化候选框参数,提升目标检测的准确性,使得最终选出的候选框具有更高的置信度并更接近目标的真实位置[15]。

(1)将待检测目标(施工现场员工人头)的候选框构成数组Ai,计算候选框分类置信度和位置信息,计算公式为:

(6)

从数组Ai中选取分类置信度和位置得分最高的候选框,使用其相关信息更新模型参数。

(2)为了获取更准确的分类置信度和位置得分,采用当前计算模型来计算数组Ai中候选框的分类置信度与位置。

(3)通过多次迭代上述步骤,不断更新模型参数并重新评估候选框的分类置信度和位置,从而得到最优的安全帽佩戴检测候选框信息。

选择深化方法是一种对抗过程,包括候选框选取、特征学习、迭代执行,通过选择和深化候选框来不断优化最终得到问题的最优解。选择深化方法的过程是首先选出分类置信度和位置得分较高的候选框,然后通过深化方法来学习未被选中的候选框中的特征。在迭代的过程中不断地重复选择与深化,从而达到逐步逼近最优解的目的。

3 实例分析

3.1 数据来源

数据来源于开源的安全帽数据集(SHWD),在该数据集中有7 581张图片,其中正样本(佩戴安全帽)个数为9 044,负样本(未佩戴安全帽)个数为111 514,正负样本比例近似为1∶12[16]。正负样本个数差距非常大,容易导致模型预测结果偏向于负样本分类,降低预测模型的泛化能力。为增加正样本数量,在SHWD数据集中增加4 000张施工现场佩戴安全帽的图像,并采用LabeLImg手动标注新增图像工人佩戴安全帽情况,共标注了18 326个佩戴安全帽的样本。

3.2 结果分析

在电脑上开展试验,电脑处理器为Intel(R) Core(TM) i5-10300H CPU @ 2.50GHz,操作系统为Windows 10 家庭中文版。各方法均采用PyTorch深度学习框架[17],设定最大迭代次数为200,学习率为0.014,同时采用等间隔方法调整学习率。将本文算法和YOLO v2[18]、YOLO v3[19]、YOLO v4[20]进行性能对比,对比结果如表1所示。

表1 算法性能对比

由表1可知,本文所提出的算法是对YOLO v4的改进,在特定层插入注意力模块,这使得全类平均正确率(mAP)数值得到了明显提升。相对于YOLO v2、YOLO v3、YOLO v4,改进的YOLO v4计算量最大,但是依旧可以满足视频监控实时检测帧率大于30帧/s的需求,同时也确保了施工现场安全帽佩戴检测准确性的大大提升。损失函数对目标检测的效果具有重要影响,分析不同损失函数的影响,结果如图3所示。

图3 不同回归损失函数训练过程

由图3可知,采用IoU回归损失函数mAP值为82.3%;采用GIoU回归损失函数mAP值为86.7%,采用CIoU回归损失函数mAP值为94.6%,即采用CIoU回归损失函数的目标检测性能最佳。同时,采用CIoU回归损失函数相对于IoU、GIoU回归损失函数,其收敛效率更高且更容易区域稳定。

对比采用多候选框策略和未采用多候选框策略,结果表明:当采用多候选框策略时,其mAP为97.8%;未采用多候选框策略时,其mAP为92.6%,即采用多候选框策略大大提升了目标检测的性能。未采用多选候选框策略出现了漏检,采用多候选框策略不仅提升了施工现场安全帽佩戴的检测性能,同时也可以有效避免漏检的出现。

4 结语

施工现场安全帽预警直接关系到施工现场工人的生命安全,提出了基于改进YOLO v4的工人安全帽佩戴检测算法。改进的YOLO v4在特定层插入注意力模块,定义了新的边界框回归损失函数,同时采用多候选框学习策略。将提出的安全帽佩戴检测模型应用于安全帽数据集SHWD,结果表明所提出的改进模型能够快速、准确检测施工现场工人佩戴安全帽情况,同时发出预警,这对降低施工现场安全管理成本,提升安全管理质量具有一定的参考价值。

猜你喜欢
候选框安全帽置信度
小小安全帽,生命保护伞
重定位非极大值抑制算法
面向自然场景文本检测的改进NMS算法
硼铝复合材料硼含量置信度临界安全分析研究
基于Soft-NMS的候选框去冗余加速器设计*
爆笑四格
正负关联规则两级置信度阈值设置方法
一种针对特定目标的提议算法
置信度条件下轴承寿命的可靠度分析
肤色检测和Hu矩在安全帽识别中的应用