基于生成对抗网络和DenseNet的数据信息安全识别方法

2022-10-27 02:44夏利玲顾建华
计算机测量与控制 2022年10期
关键词:异物安全性图像

夏利玲,顾建华

(盐城工业职业技术学院 信息与安全学院,江苏 盐城 224005)

0 引言

伴随着我国电力设备的不断建设以及输电线路的不断延伸,传统电力巡检工作模式一方面因为严重依赖人力方式解决,人工成本较高,另一方面由于受限于如地形、天气、人员经验等多种因素影响,想要在全天候条件下完成对电力巡检数据信息安全性的排查工作,存在一定安全风险,这导致传统电力巡检方式已无法满足我国电力发展现状。因此数据信息采集设备被广泛应用于电力巡检任务中。日常电力巡检工作的主要内容包括:对电力线路进行异物检测[1],避免出现因为异物遮挡而造成安全隐患事件。对重要电力设备的潜在安全风险进行评估,必要时为电力设备进行维护与抢修提供依据。对电力设备缺陷进行日常排查,做到早发现早解决。虽然通过智能采集设备可以获取到相关电力设备的数据信息,例如利用无人机[2]进行电力巡视,利用电子监控设备对电力设施的安全状况进行实时监控等,且这类方式具有全天候工作、跨越地形限制、节约人力成本等优点,但依旧需要经验丰富的人力对采集到的数据信息的安全性进行主观分析,存在漏检和错检的风险。针对上述问题,如何对数据信息的安全性进行有效识别[3]并提高识别效率,是目前研究人员要重点解决的问题。图像数据具有蕴含信息量丰富、可跨距离、传输速率快等优点,因此图像数据成为人类获取数据信息的主要载体[4]。目前关于电力巡检数据安全性识别检查方法主要针对三种电力巡检数据类型:可见光照条件下采集到的数据类型、红外[5]和紫外光照条件下[6]采集到的数据数据类型,并对这三种数据类型开展智能信息安全性检测。本文主要针对在自然可见光条件下采集到的电力巡检图像数据,同时结合深度学习技术训练网络模型,实现对数据信息的安全性进行有效识别,具有识别效率高、高准确率和可靠性强等优点。

当前图像数据信息识别方法可以分为两类,第一类是传统基于目标物识别的方法,此类方法多数是基于待选区域特征提取的目标安全性识别方法,如文献[7]采用滑动窗口在待识别图像上对区域特征进行滑动提取。文献[8]是较早将红外图像数据应用于电力线路相关信息安全性检查的方法,主要思想是使用自适应方法,利用自然可见光照条件下原始电力设备图像与其红外光照条件下的图像进行背景校对,以增强红外图像数据信息质量,实现对电力线路相关信息的安全检测。针对文献[8]方法存在对高噪声抑制效果不佳,容易产生电力线路相关信息安全识别度低的问题,文献[9]将彩色图像融合技术应用于红外图像高噪声抑制问题,有助于提升输出图的视觉效果,经实验验证增强后的输出图可有效提升电力线路数据信息安全性识别准确度。传统图像数据信息安全性识别方法虽然一定程度上可以实现对电力巡检数据信息的安全性识别,但受制于计算机硬件性能上限,以及数据量有限等问题,识别结果存在鲁棒性差,抗噪声能力弱等缺点。第二类是基于深度学习技术特征提取的数据信息安全性识别方法,如SIFT(scale invarint frature transform)因为其在目标识别过程中可对目标进行滤波,并且在关键节点的提取和创建上具有独特优势,被众多识别模型应用,文献[10]首次将SIFT应用于电力塔侧倾检测问题上,并取得不错的效果,其主要思想是通过SIFT计算电力塔的关键节点,最后经过计算匹配度完成对电力塔侧倾问题的检测。文献[11]是较早利用R-CNN(region-convolutional neural networks)进行目标识别的方法,主要思路是对待识别图像通过分类,组成多个待判别区域构成的层次组,最后进行分类识别。随着卷积神经网络模型(CNN, convolutional neural network)结构的不断改进,诞生了许多改进方法,文献[12]创新性的将数据信息安全性的识别过程分两个阶段,第一阶段主要对数据信息中含有待识别目标的区域进行识别,第二阶段对区域内的目标通过类别标签匹配完成对数据信息安全性的识别。虽然基于深度学习技术特征提取的数据信息安全性识别方法在精准度方面取得较大进步,但因为电力巡检相关图像数据存在特殊性,用于识别网络训练的数据集缺少多元性,导致多数情况下只能对有限的数据类型特征进行提取,无法做到对整体数据类型的特征进行表达。

针对目前电力巡检采集到的图像数据缺乏统一性的问题,本文提出一种基于生成对抗网络[13]和密集连接网络的数据信息安全识别方法,解决电力巡检任务采集数据困难,以及传统CNN识别方法存在梯度爆炸等问题。

1 数据信息处理和安全性识别方法

1.1 生成对抗网络

生成对抗网络(GAN, generative adversarial nets)[14]是由生成器G(generator)网络和判别器D(discriminator)网络二者相互竞争组成,GAN组成结构如图1所示。以生成图像为例,首先,随机噪声z输入G网络,输出伪造图像G(z);其次,从预先准备好的数据集中抽取真实图像x,同时与G(z)作为输入一起传入D网络,由D网络负责鉴定输入图像是真实图像还是伪造图像,在此期间,G网络一直在不断提高生成能力,D网络一直在不断提高判别能力,G网络与D网络二者间不断相互竞争;最终,当D网络无法对伪造图像G(z)的真伪做出正确判断时,说明此时的G网络与D网络相互之间保持在一种动态平衡的状态,此时G网络的生成效果最佳。

图1 生成对抗网络原理图

最后给出GAN的目标函数:

Ex~PG[log(1-D(x))]

(1)

其中:V为 D网络和G网络的最终优化目标;E为数学期望;x~Pdata表示数据来源于真实数据;G(z)为生成的伪造数据;D(x)和D(G(z))为D网络分别对真实数据和生成数据进行判别的结果。

1.2 条件生成对抗网络

由于传统GAN中生成器网络过于自由导致无法有效控制生成内容,造成生成效果欠佳。条件生成对抗网络(CGAN, condition generative adversarial nets)[15]对传统GAN加入了约束条件,起到了监督作用,一定程度上控制了生成器的输出,CGAN的网络结构如图2所示。

图2 CGAN的网络结构图

CGAN的目标函数表达式如下:

Εz~P(z)[log(1-D(G(z,y)))]

(2)

其中:x代表真实的图像数据;y代表约束条件;z代表随机噪声,目标函数的作用是要最小化生成器D网络的生成结果与真实结果之间的分布距离。

1.3 密集连接网络

基于CNN的深度学习模型虽然在图像处理方面取得不错的成果,但也存在发展瓶颈,最突出的问题就是在训练过程中,深度学习模型的准确率会随着网络层数的复杂化而降低,这类现象被称之为“梯度弥散”现象,随着对生成对抗网络研究的不断加深,梯度弥散现象是一个急需解决的问题,虽然出现了WGAN(wasserstein GAN),其优势是采用Wasserstein距离替代原始的JS散度衡量办法,实现对生成数据分布与真实数据分布之间距离差异更加平滑的刻画,可有效解决梯度弥散现象,但由于WGAN的先决条件是要满足Lipschitz约束条件,并对参数取值范围使用Weight Clipping截断操作,导致网络对分布在边界处的权值处理效果不佳,造成WGAN网络梯度学习速度较慢,影响网络收敛速度。针对WGAN中存在的不足,而后出现了(WGAN-GP),使用梯度惩罚项代替原始WGAN中的Weight Clipping截断操作,实现解决梯度弥散现象的同时有助于网络平稳训练,但因为缺乏对梯度惩罚项的泛化,导致WGAN-GP对数据分布之间距离差异刻画的多样性欠佳。针对上述问题,残差网络(ResNet, residual neural network)[16]因此诞生,其特点在于建立前一层与后一层间的快速连接,实现提升训练过程中梯度反向传播的速度。密集连接网络(DenseNet, dense connection net)[17]的构建思想类似于ResNet,它们二者的结构区别如图3所示。

图3 残差网络与稠密连接网络

DenseNet与ResNet的区别在于,A层输出和B层输出并不是作加法,知识对层与层之间做通道维度上的连接,如图3(b)所示,A层的输出直接和B层后面所有层进行连接,其优势在于特征重用以及方便梯度传递,可以有效缓解梯度消失。DenseNet由多个稠密连接模块(Densely Connected Block)[18]组成,由于采用这种密集连接不需要进行卷积操作,如图4所示,所以产生的参数较少,可以让DenseNet在参数、样本和计算成本更少的任务中获得比ResNet更具有优势的性能。

图4 DenseNet连接示意图

假设传统CNN中一共有N层,那么一共会产生N个连接,而在DenseNet中,N层网络结构一共会产生N(N+1)/2个连接,以图4为例,是一个四层结构的DenseNet Block,其中x1,x2,x3,x4表示每一层输出的特征图;H1,H2,H3,H4表示每一层的非线性变换。具体过程从x0输入卷积层开始,依次通过H1卷积层后得到输出x1,接着合并x0,x1,结果作为输入传入第二层,输入H2卷积层得到x2,再将x2与x0,x1通道维度合并作为第三层的输入,如此循环反复,直到最后第四层输出的特征结果包含前面所有层的特征输出。由于DenseNet采用稠密连接方式,每一层都直接与输入的特征信息和损失函数连接,使特征信息和梯度值在网络训练过程中可以更加高效地传递。

2 本文方法模型

本文方法模型一共包含两部分功能模块:

1)基于条件生成对抗网络的数据扩充模块,该功能模块负责在有限规模的数据集条件下通过对网络的不断训练,得到具有较好生成效果的生成器网络模型,实现生成拥有较高图像质量的电力巡检数据,完成对现有电力巡检图像数据集的扩充。有效改善实际情况下电力巡检数据存在采集困难的缺点,同时扩充后的数据集为下一步提升深度学习网络对电力巡检数据信息安全性识别精准度提供了可靠的数据基础。具体实现步骤为:首先,将随机噪声z作为输入传入条件生成对抗网络,其中生成器G网络在约束条件即预先准备好的电力巡检图像数据的引导下生成逼真的电力巡检图像数据;然后,将生成图像作为输入传入判别器D网络,并在约束条件的辅助下进行真伪判别,利用损失函数反向优化生成器D网络与判别器G网络的权重参数;最后,当损失值更新停滞不前时,得到具有较好生成效果的生成器G网络,并利用其生成能力,生成逼真的电力巡检图像数据来弥补现有数据集规模有限与类型单一的缺点。

2)基于DenseNet的电力巡检数据信息安全识别模块,该功能模块负责对电力巡检数据集中的目标物进行特征提取,引导网络训练不断收敛,完成对数据信息中目标物的检测,实现对电力巡检数据信息安全性的识别。具体实现步骤为:首先,将扩充后的数据集作为输入,并划分为待识别集与目标集,其中目标集中的标签已被预先处理好,待识别集中的标签是需要被分类识别的;然后,利用DenseNet的稠密连接方式对待识别图像数据特征进行提取学习,快速定位出待识别数据信息中包含待识别物所在的区域,紧接着计算其与目标集中提取到的特征信息之间距离分布差异,并利用池化层分类器对目标进行分类识别,对待识别物的位置和类别进行精细化判别;最后,根据类别情况给出识别标志,辅助工作人员对数据信息的安全性进行识别[19]。其中DenseNet映射公式为式(3),DenseNet特征提取公式为式(4)。本文对电力巡检数据信息安全性的识别方法流程如图5所示。

图5 本文识别方法流程图

XL=HL([X0,X1,...,XL-1])

(3)

F=f+t×L

(4)

其中:XL表示第L层特征通道数的输出;[]表示对第0层到第L-1层的所有特征输出进行通道维度的合并;HL()表示对第L层使用卷积操作+批归一化+Relu的非线性变化。F表示经过一层密集连接后的的通道数;f表示经过一层密集连接前的的通道数;t表示通道增长率;N表示层数。

3 实验分析

3.1 实验数据集

由于电力巡检图像数据涉及国家安全相关信息,一般很难对外公开,因此本文利用现有公开的电力巡检图像数据通过输入本文提出的CGAN来生成样本数据,实现对数据集规模的扩充,同时增加样本数据集的多样性。

3.2 实验环境及设备

本次仿真实验的条件生成对抗网络在训练期间学习率为固定参数0.000 2,迭代次数为600次,batch-size为64,Adam参数设置为:一阶矩估计的动量参数的指数衰减率b1=0.5, 二阶矩估计的动量参数的指数衰减率b2=0.999,另外依据深度学习衰减策略,当网络训练过程中遇到损失值无法更新迭代时,需将模型网络学习率下调至原学习率的一半,同时结合普归一化和梯度惩罚对判别器进行收敛控制,确保网络模型的稳定训练,本次仿真实验在训练到第56轮和第112轮时,对网络模型学习率进行下调,调整到原始学习率的十分之一,实验环境参数如表1所示。

表1 本章实验环境配置

3.3 评价指标

图像数据信息识别评价标准通常使用平均检测精度(mAP)[20],mAP的计算包括两项:精准度(Precision)计算和召回率(Recall)计算,二者的数学表达式为式(5)、式(6),Precision和Recall的调和平均数使用F1-Score,其数学表达式为式(7):

(5)

(6)

(7)

其中:TP表示图像数据信息被识别网络正确识别出非安全性异物的样本数量,FP表示图像数据信息被识别网络错误识别出非安全性异物的样本数量,FN表示图像数据信息中存在的异物未被识别网络正确识别出的样本数量。

3.4 实验结果与分析

仿真实验最后采用准备好的验证数据集对方法模型的精准度进行检验,验证本文方法对图像数据信息中存在的异物具有较高的识别正确度。识别结果展示如图6所示,需要说明的是测试集中共有样本180张,其中将非安全性异物类别进一步划分为重视类和警惕类,重视类主要包含一些非生命的环境障碍物,如树叶、绝缘子、车辆等。警惕类主要包含一些需要及时处置的障碍物,包括人物、塑料袋、鸟类等。当数据信息中包含警惕类非安全性异物时,需要方法模型能够快速进行识别并给出警惕报警,利于巡检人员第一时间进行确认和排查。

图6 数据信息安全性识别检测结果

如图6(a)所示,本文方法准确识别出图像数据信息中包含警惕类异物,并且给出了所属类别为人物的概率值为0.875,说明该图像数据信息的安全性需要得到警惕。图6(b)是本文法规范准确识别出图像数据信息中的绝缘子,并给出所属类的概率值为0.891,方便电力巡检人员快速对图像数据信息安全性进行判断,并对其安全工作运行状态进行评估。

本文经过多次仿真实验测试,最终得出在学习率固定为0.000 2,并且识别方法模型训练到第23000轮时,本文方法的识别精准度最佳,对重视类和警惕类非安全性异物的识别结果如表2所示。从表2可以看出本文方法对大部分异物的识别正确度较高。尤其是对警惕类别中的车辆、人物、鸟类、塑料袋具有较高的识别正确度,特别是针对人物和车辆的识别指标Recall值得分表现优秀,可以证明本文方法对数据信息的安全性识别覆盖率较高,不易产生漏检和错检的现象。警惕性异物中鸟类事件因为具有很强的随机性和不确定性,对其及时进行安全性检测一直是电力巡检过程中的难点和重点,从表2结果中可以看出本文方法对鸟类的正确识别率处于次优位置,说明本文方法可以对警惕类别中的鸟类做到有效检测。但是对塑料袋异物和树叶的识别度表现欠佳,这一定程度上是因为塑料袋形状的过于多变且形状不规则,对其正确识别结果造成一定影响,而树叶作为异物识别目标,由于目标体积较小导致不易识别。本文针对塑料袋与树叶这两类异物存在不易识别且识别正确度不高的问题,采取高斯滤波法对图像进行预处理,高斯滤波法主要是对图像边缘区域的高频噪声进行过滤,可以对内容信息进行增强处理,有助于增强方法模型的泛化能力,仿真实验结果表明本文方法对先经过高斯滤波法处理后得到结果图,再对其进行数据信息安全性识别,最终结果的AP得分与Recall得分相比较无高斯滤波法处理的结果均有较明显的提升,对比结果如表2所示。

表2 数据信息安全识别结果

为进一步验证本文方法采用CGAN生成图像数据以扩充现有数据集,实现提高数据信息安全识别目标正确率的有效性,本次实验分别使用数据扩充前和数据扩充后的数据集,同时进行15000轮训练后得到的测试结果对比如表3所示。其中原始数据集扩充前,共包含180张真实图像数据,经扩充后新增360张由CGAN生成的电力巡检图像数据用以扩充原始数据集规模,实验使用40张图像数据分别对模型进行测试,从表3中结果可明显看出,使用CGAN生成数据得到扩充后的数据集,对方法模型进行训练后,其评价指标的Precision值,Recall值,F1-score值得分情况均有明显幅度的提升,提升率分别为22.1%,13.8%,21.8%。证明本文使用CGAN对有限数据集进行扩充,从而提高方法模型对数据信息安全识别准确度的方法具有较好的实施效果。

表3 数据集扩充识别结果

电力巡检数据信息安全性检测方法之所以因其为我国电力设施承担相关安全事故检测与预警工作,所以电力巡检数据信息安全性检测方法模型需具有高可靠性与稳定性。目前在深度学习领域借助统计学思想提出,在极端情况下模型对边界值也能保持平滑、可靠的性质,被称之为鲁棒性。进一步如果一个网络模型的鲁棒性越好,意味着该模型具有三大优点:具有高精准度和多数有效性;在模型遇到较小偏差值时,模型整体性能只受到较小影响;在模型遇到较大偏差值时,模型整体性能并不会出现“灾难性”的结果;图7是本文方法模型在测试集上关于Recall, Precision的得分分布情况,从中可以看出本文法模型对于大部电力巡检图像数据信息的安全性识别得分较高,且得分分布情况趋近于正态分布,表明本文方法模型具有较强的鲁棒性,证明本文方法模型具有较高的可靠性与稳定性。

图7 本文方法在扩充数据集上的Recall和Precision得分分布情况

4 结束语

针对电力巡检任务采集到的数据,需要进行信息安全识别的问题,本文提出一种基于CGAN和DenseNet的数据信息安全识别方法。首先,本文使用CGAN,在现有数据的规模基础上生成逼真的数据集,解决电力巡检任务采集数据较为困难的缺点;然后,利用DenseNet搭建识别网络,对数据信息的安全性进行识别,判断出异物类别,相比传统人工巡检方式,不仅可以提升工作效率,还可以节约资源;最后,通过对仿真实验,证明本文方法对数据信息的安全性具有较好的识别效果。

猜你喜欢
异物安全性图像
两款输液泵的输血安全性评估
新染料可提高电动汽车安全性
基于生成对抗网络的CT图像生成
食管异物不可掉以轻心
如何处理异物进入眼睛
浅析p-V图像中的两个疑难问题
某既有隔震建筑检测与安全性鉴定
巧用图像中的点、线、面解题
加强广播电视信息安全性的思考
眼耳鼻进异物咋处理