基于深度学习的泥石流孕灾区域识别

2022-04-29 03:51彭娟王保云杨丽彬孙显辰张漫迪
电脑知识与技术 2022年4期

彭娟 王保云 杨丽彬 孙显辰 张漫迪

摘要:针对目前基于遥感影像技术的泥石流孕灾区识别自动化较低、对全局特征表征有限等问题,该文提出了基于AlexNet神经网络的泥石流孕灾区识别方法。基于云南高原山区DEM数据,利用区域生长算法对泥石流孕灾沟谷实现对象识别、分割和验证。在对数据集进行数据增强后,通过深度学习网络设定和数据类别确定,进而对泥石流孕灾沟谷的全局特征进行有效学习,并实现了对沟谷发生泥石流次数的准确分类。同时,该文基于验证集、测试集的平均分类精度及混淆矩阵,对模型进行验证,实验结果表明该模型针对泥石流孕灾区能够取得较为高效准确的识别效果,分类预测平均准确率可达94%。

关键词:AlexNet;区域生长算法;泥石流孕灾区

中图分类号:TP3        文献标识码:A

文章编号:1009-3044(2022)04-0090-02

1 引言

泥石流常发生于特殊的地形、地貌地区,我国疆域广阔,地质构造复杂,泥石流频发,对居民生命安全产生巨大威胁[1]。对此诸多学者充分利用多源数据的特性,综合运用机器学习算法和野外调查以进行泥石流灾害调查评估。但目前基于遥感技术的泥石流孕灾区域的识别过程大多基于面向对象分割算法或统计参数来进行。此类算法对全局特征的表征能力有限,难以推广到大范围的泥石流孕灾沟谷识别中。深度学习[2]可以拟合任意复杂函数,能从训练数据中自动学习样本特征而不需要人工调整特征参数。近年来,一些学者将其应用到遥感影像处理中,包括土地覆盖类型分类[3]、目标识别[4]等,深度学习成为学者们的一种选择。

有鉴于此,本文提出了基于AlexNet网络的泥石流孕灾区识别方法。通过区域生长算法得到云南省怒江流域河流沟谷遥感图像,并与历史灾害数据对应。通过神经网络进行发生泥石流灾害次数的预测分类。该方法能自动表征物体的细节特征,避免人为设定特征、权重系数,解决特征提取的稳定性问题。通过本文方法在完成模型训练后,能够对测试集进行预测,分类结果准确率可达94%。通过对泥石流次数的沟谷分类,能够对未验证泥石流灾害区的防范提供科学的指导意见。

2 算法原理

2.1 区域生长算法

将相似的像素或区域合并为同一区域[5],在没有先验知识基础的情况下,能够在分割复杂图像的任务中取得较好的结果。通过计算同一区域内像素的相似性质将相邻连通区域中具有同样性质的像素归并来实现区域的扩增。本文采用八连通的区域生长算法来识别河流主干和河流支流。

2.2 Alexnet神经网络模型

2.2.1 网络架构

AlexNet拓展了LeNet的网络结构,从而增强了学习高维和更复杂图像特征的能力。网络模型为8层结构,其中前5层为卷积层,后3层为全连接层。模型结构如图1所示。

2.2.2 输入层

AlexNet模型输入层接收224×224×3的图像。

2.2.3 Padding层

图像扩充使得实际处理过程从新补充的边界进行操作,从一定程度上解决了卷积导致的丢失边缘信息问题。

2.2.4 卷积层

卷积层负责学习图像特征,卷积核在图像每个位置进行变换和映射运算,再通过激活函数提取图像的特征。卷积层的计算公式为:

上式中,X为输入的图像,W为三维卷积核,b为偏置项,relu()为激活函数,yconv为卷积结果。

2.2.5 重叠池化层

池化层位于各卷积层之间,是神经网络中某一层的静态属性,传递卷积层学习到的特征信息至池化层进行特征选择和信息过滤,降低信息冗余。本模型采用重叠的最大池化,其公式为:

上式中,x为图像中3×3块内的九个像素,ymaxpool为最大池化结果。

2.2.6 全连接层

全连接层中的每个神经元与其前一层的所有神经元进行全连接运算操作,整合具有类别区分性的局部信息,最后一层通过激活函数后,作为模型的预测结果。采用ReLU激活函数,可避免网络较深时可能产生的梯度弥散问题。

2.2.7 输出层

模型的输出层采用softmax进行回归分类,将输出层的数值转化为每个类别的预测概率。

3 实验数据与研究过程

3.1 实验数据

实验所涉及的图像数据来源于美国地质调查局网站(http://www.usgs.gov/)。

3.2 研究過程

本实验的输入数据为DEM数据,应用区域生长法来进行沟谷主体的识别,根据泥石流沟长度与宽度属性,构造包含该沟谷的外接矩形,得到影像切片;结合泥石流历史灾害的位置数据,通过经纬度对应进行类别标注,形成沟谷数据集;数据集划分为4类,泥石流灾害发生次数标签分别为:0次、1次、2次、3次及以上;设定AlexNet模型进行泥石流孕灾沟谷识别,对未给定类别标签的沟谷做出预测;最后对实验结果进行统计分析。

4 环境搭建与实验设置

本研究的实验环境:深度学习工作站,Intel Xeon处理器,8GB内存,显卡型号GeForce RTX 2080 Ti,编程环境python 3.7。利用Tensorflow深度学习框架泥石流沟谷数据集大小为480。训练集、验证集和测试集采用随机选取的方式划分,每类图像抽取20个样本作为测试集,余下样本的10%作为验证集,90%作为训练集。学习率为0.001,dropout为0.2,batch大小为32,迭代次数100次。

5 实验结果与分析

5.1 准确率

准确率变化曲线如图2,模型训练在epoch接近100时,训练集准确率及验证集准确率都取得了相对训练的前阶段更高的值,说明模型在循环训练100次时,识别效果良好。

5.2 对比实验

为进一步验证模型效果,本文将AlexNet模型与Lenet模型进行对比实验,结果如表1,实验证明本模型具有更好的识别效果。

6 总结

针对目前基于遥感影像的泥石流沟谷识别数据库缺乏和相关算法的局部性,本文对DEM数据进行识别和分割,基于深度学习网络循环反馈改进机制,实现对泥石流沟谷的分类,准确率达94%。相较于单一从某特质分析及传统的神经网络,该模型取得更好的预测结果,对于泥石流灾害的防治具有现实意义。但本研究实验数据不充足,需要进一步收集整理,获得更多有标注数据,优化设计模型泛化能力。

参考文献:

[1] 张楠,方志伟,韩笑,等.近年来我国泥石流灾害时空分布规律及成因分析[J].地学前缘,2018,25(2):299-308.

[2] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436.

[3] Kussul N, Lavreniuk M, Skakun S, et al. Deep Learning Classification of Land Cover and Crop Types Using Remote Sensing Data[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 14(5):778-782.

[4] Gong C, Yang C, Yao X, et al. When Deep Learning Meets Metric Learning: Remote Sensing Image Scene Classification via Learning Discriminative CNNs[J]. IEEE Transactions on Geoscience & Remote Sensing, 2018, 56(5):2811-2821.

[5] 韓纪普,段先华,常振.基于SLIC和区域生长的目标分割算法[J].计算机工程与应用,2021,57(1):213-218.

收稿日期:2021-06-02

基金项目:云南省大学生创新创业训练项目(D2019087)

作者简介:彭娟(1999—),女,云南大理人,学士,数据科学与大数据技术专业。