基于YOLOv5 的绝缘子图像自动标注

2021-05-28 06:18徐文静高云天叶泽恩天津工业大学天津300387
科学技术创新 2021年14期
关键词:绝缘子边界准确率

徐文静 高云天 陈 晨 叶泽恩(天津工业大学,天津300387)

绝缘子是输电线路中常见绝缘器件,需要对其进行故障检测。利用人工智能技术[1]可以提升绝缘子故障检测的智能化,而且借助人工智能技术自动识别绝缘子故障已成为一种趋势。但是,目前智能的识别方法依赖于有标注的样本库。

目前图像标注方法主要有两种:一种是利用LabelMe、Label Image[2]等标注软件进行人工手动标注,这种方法在标注大量数据集时往往费时耗力。另一种是利用开源数据集“外包平台”和调用API 进行标注,这种方法增加了维护成本。因此,需要研究适合绝缘子检测的图像自动标注方法。本文的目的就是设计一种绝缘子图像自动标注方法。

1 YOLOv5 模型综述

YOLO(You Only Look Once)是目标检测领域常用的神经网络模型,直接输入整张图片,是端到端的网络模型。YOLOv5模型是YOLO 模型的版本之一,在v5 发布前有v1、v2、v3、v4 等版本,其网络结构不断强化,模型训练速度不断提升。YOLO 官方[3]发布的YOLOv3 网络与其它网络性能对比情况如图1 所示。

图1 YOLOv3 与其它网络性能对比[3]

由图1 可知,YOLOv3 模型具有高准确率、低耗时等特点。与v3、v4 等版本相比,v5 版本模型训练速度更快,精确度更高。

使用YOLOv5 模型,只需适当调整模型参数,训练模型后,便可准确检测绝缘子图像。如图2 所示,绝缘子图像自动标注的实现流程可分为模型训练和自动标注两部分,模型训练过程包括人工标注、构建数据、调整参数、训练数据、测试数据等五步。

图2 绝缘子图像自动标注技术流程图

2 绝缘子图像自动标注算法

2.1 网络框架

在整体网络结构方面,YOLO 模型使用与GoogLeNet 结构相似的神经网络[9],将3×3 的卷积核作为过滤器,使用1×1 的卷积层来减少通道规模。总体上说,YOLO 网络有24 个卷积层,2 个全连接层。输入图像经该网络处理后,在输出端的全连接层输出一个S×S×(5×b+c) 的张量,其中S×S 为方格个数,b 为预测边界框个数。

2.2 特征提取

YOLO 在特征提取方面进行了改进。传统应用中,目标检测网络(如RCNN 和SSD)多为分类问题,YOLO 则将其视为回归问题,直接输入整张图片,不再使用全链接层,形成端到端的网络,使模型的训练效率大大提高[6]。边界框回归(Bounding Box Regression)是其回归思想的体现,使用边界框回归算法即可在大量候选框中找到准确的标注框,过程如下:

2.2.1 分割网格

使用滑窗口切割整张图片为S×S 个网格,若待测物体中心恰好落在网格中,那么该网格就可负责预测该物体,每个网格在目标中心产生多个大小不同的候选框,通过平移和缩放对其回归如图3 所示,回归计算方法[3]为:

图3 边界框回归

在遍历所有网格后,在网络输出端输出置信度,置信度是候选边界框和真实边界框的交并比IoU,计算公式为[5]:

式中:A、B 分别为真实边框和候选边框的面积。

YOLOv5 对IoU 进行改进,GIoU[7]便由此产生,其方法是找到一个最小封闭形状C,让C 将边框A 和B 包围在内,然后计算C 中未覆盖A 和B 的面积占C 总面积的比例,计算公式为:

在算法求解时,将损失函数GIoU Loss 与非极大值抑制算法(Non-Maximum Suppression,NMS)结合,搜索局部极大值即可得到准确的标注结果。

3 训练及结果分析

使用Python 语言并基于Pycharm 对提出的绝缘子自动标注算法进行编程实现。使用1300 张人工标注的绝缘子图像对搭建的YOLOv5 网络模型进行训练,再用2750 张未标注的绝缘子图像对训练的模型进行测试。

3.1 模型训练

由于YOLOv5s 使用的是PASCAL VOC[4]数据格式,故这里先将待训练的绝缘子图像进行格式化处理,处理过程如图5 所示。由图5 可知,在进行网络训练之前,将人工标注的xml 格式文件转化成txt 格式文件,再将txt 文件内容分别写入Test.txt、Train.txt、Val.txt、Trainval.txt 保存。

图5 YOLOv5 数据格式

在训练前可设定YOLOv5 模型参数初值[7],随后根据训练结果调整。经多次试验,学习率为0.0005,训练次数epochs 数值为300,单次训练图像数batch-size 数值为5,总耗时4h53min,训练速度较快。

3.2 模型评价

使用插值平均精度方法评估目标检测的结果,计算准确率P和召回率R 并绘制P-R 曲线[8]。平均准确率AP 和总平均准确率mAP 可作为评价模型的指标,AP 由精确率和召回率求平均得到,mAP 由所有的AP 值求平均得到。

式中:TP 为准确检测出绝缘子的数量,FP 为将其它物体检测为绝缘子的数量。

式中:FN 为将绝缘子检测为其它物体的数量。

使用2750 张未标注的绝缘子图像进行验证,图6 为评价结果,(a)图中mAP 值为0.951,这说明其精度较高。(b)、(c)图为绝缘子图像的物体检测信息和物体检测准确率,测试结果良好。

图6 模型评价结果

3.3 自动标注

选取最优模型对新数据集进行预测,在绝缘子图像中用边界框标注出待检测物体。预测边界框左上角含有信息和准确率,在同名文件夹中生成标注文本,其格式如表1 所示。

表1 绝缘子标注信息

如表1 所示,标注信息文件中包括x、y 坐标和类别序号(0为绝缘子,1 为其他物体)。表中可知该张图像中含有2 个绝缘子,其序号分别表示为0,横纵坐标的极值显示在文件中。

基于YOLOv5 模型的自动标注效果显著,如图7 所示,(a)中绝缘子分布均匀,由图可知标注出3 个绝缘子且准确率分别为0.86、0.93、0.86。另外几种常见特殊标注情况,准确率均值可达0.80 以上。(b)目标过大/过小、(c)标注框嵌套、(d)边框重叠。

图7 预测标注信息

4 结论

设计了一种基于YOLOv5 的绝缘子图像自动标注方法,该方法具有高效、准确、轻体量的特点,可在短时间内生成大量带有标注信息的绝缘子图像数据,为绝缘子故障的自动识别提供有力保障。

猜你喜欢
绝缘子边界准确率
基于Mask RCNN的绝缘子自爆缺陷检测
守住你的边界
突破非织造应用边界
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
零值绝缘子带电检测方法探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
意大利边界穿越之家
浅析输电线路绝缘子防污闪技术