基于原型网络对泥石流沟谷的分类预测
——以怒江流域为例

2022-04-14 03:27王保云徐繁树刘坤香
现代计算机 2022年2期
关键词:泥石流因子样本

韩 俊,王保云,徐繁树,刘坤香

(1.云南南师范大学信息学院,昆明 650500;2.云南南师范大学数学学院,昆明 650500;3.云南省高校复杂系统建模及应用重点实验室,昆明 650500)

0 引言

泥石流灾害是一种主要由强降雨引发的自然灾害,泥石流灾害给周围的城镇和村庄带来严重的财产和生命损失。云南是全国泥石流发生最高频的省份之一,对泥石流灾害的预防是一项重要的研究工作。泥石流的预测尚没有精确的方法,高速等简述了目前泥石流常用的预测方法。翟淑花等基于遗传规划对包括降雨量、流域面积、松散物质比率及沟床平均坡度等因子建立模型对泥石流发生进行预测。

随着数据量的增加,使用机器学习以及深度学习的方法对泥石流数据进行预测取得了良好的效果。唐旺等基于LSTM模型对西北地区的降雨量与泥石流进行训练,通过降雨量对泥石流预测取得良好的预测效果。孙显辰基于深度迁移学习的方法对云南怒江流域的泥石流沟谷数字高程模型(DEM)图按发生次数进行分类预测,取得了良好的分类效果。赵岩等详细构建了引发泥石流相关因子的数据库,并使用深度学习的方法来识别泥石流堆积扇,使用线性回归的方式对泥石流发生进行预测。

目前,使用泥石流沟谷图像的深度学习大多是对泥石流堆积扇的识别,本文采用深度学习中的小样本学习方法,对泥石流沟谷图像正负样本进行训练,从沟谷形态特征上实现对泥石流发生与否的概率预测。

1 泥石流沟谷图像数据构建

文中的数据来源依据主要是云南怒江流域相关监测站的记录及网络新闻报告。对记录发生的数据,按记载信息结合地图,确定到具体发生的村和沟谷,此沟谷作为确定发生的沟谷之一。通过查找,共找到50条确定发生的泥石流沟谷。同样地,查找50条没有任何发生泥石流记录且人员密集居住的沟谷作为负样本。

目前常用的遥感影像主要有数字高程模型(DEM)和遥感两类数据,文中采用谷歌高清遥感地图,如图1所示,对某一条样本沟谷,采用正俯视、左斜下俯视、右斜下俯视,沟口仰视、上下翻转俯视进行截图。除了正俯视,其他几种截图都作为对此沟谷的数据增强。随机选择正负样本中各10份正俯视图作为测试集,其余80份数据的正俯视及数据增强作为正负样本的训练集。

图1 纬度:26.643457,经度:98.905072的高清遥感沟谷图

因为数据量少,将截取的图像抠出完整沟谷。同时,为保障数据的大小比例,将同一位置的图,按照ArcGIS中DEM比例尺,缩放到同一比例下,然后对短边进行填充操作使之成为宽高相同的图形。训练的时候只进行缩放,不再进行随机裁剪和旋转等操作。

2 小样本学习

小样本学习是指在样本量很少或者标注样本很少的情况下实现对样本的正确分类和识别。不同学者对小样本方法的分类不同。总体而言,小样本学习方法有:微调方法、度量学习方法和元学习的方法等等。

原型网络(prototypical networks)由Snell J等人于2017年发表在NIPS上,是小样本学习度量方法中的经典模型。其思想主要如图2所示。

图2 原型网络

支持集通过特征提取器提取特征,C、C、C分别为各类支持集特征向量的均值,x^为查询向量,将x^提取特征后与C、C、C做欧氏距离,距离越小,x^属于这一类的概率越大,最终完成分类。

3 实验结果

实验只分正负样本,即N-way为2,K-shot为5,使用Conv-4和ResNet-12作为骨干架构来提取图像特征。准确率有微小波动,因此选取5次实验的均值作为实验结果。重要的超参数有学习率lr:0.01、dropout率:0.3、epoch:450。重新从正负样本中,再次随机选择正负样本中各10份正俯视图作为测试集进行第二轮实验。结果如表1所示。

表1 2-way 5-shot下原型网络对泥石流遥感图像的预测结果

通过以上实验,可以发现,对泥石流沟谷遥感图像特征的提取ResNet12优于Conv_4,取Resnet12两次的平均结果,正确率为65.60%。这意味着,对于同流域的其他沟谷图像,此模型有65%的可信度认为某一沟谷图像具有发生或者是未发生的泥石流沟谷的特征,如果预测为发生泥石流沟谷图像的类,那么此沟谷可能有发生泥石流的潜在可能,当雨季来临时,沟谷附近的人应该提前做好防范措施。

4 结语

赵岩等目前对泥石流形成因子总结较为全面,其中地貌条件是泥石流发生最基本的条件。本文中截取的沟谷高清遥感图保留了沟谷长度、流域面积、沟谷形态等地貌条件因子,还包括植被覆盖、土地利用等物质条件因子。借助神经网络对正负样本的这些特征进行学习和预测,是一个极好的方法,但也存在一些问题,首先,此样本遥感图样本量极少且包含的信息有限,如高程差等信息缺失;其次,由于目前泥石流发生的背景、形成机理等认识不深,单一靠一个方面的条件来判断,能提高的精度有限。降雨量是一个重要的诱发因素,将诱发因素、物质条件和地貌条件综合考虑的多模态深度学习可能会取得更好的预测效果。最后,小样本深度学习自身的发展还不够完善,好的建模才能继续提高预测精度。

猜你喜欢
泥石流因子样本
一类常微分方程的解法研究
直径不超过2的无爪图的2—因子
图的齐次因子分解
巧解难题二则
泥石流
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
机械班长
基于支持向量机的测厚仪CS值电压漂移故障判定及处理
七年级数学下册期末检测题(B)