基于张量补全的降雨预测

2022-06-24 10:02朱浩华丁雪琴刘光灿
计算机应用与软件 2022年4期
关键词:降雨卷积矩阵

朱浩华 丁雪琴 刘光灿

(南京信息工程大学江苏省大数据分析技术重点实验室 江苏 南京 210044)

0 引 言

四川省区域之间的降水量分布相差甚大,最多的年降水量区域能达到1 700毫米以上,最少的区域不足400毫米,与长江中下游地区均匀分布的降雨量形成了鲜明的对比。山洪形成与降雨历时关系密切,高强度的集中降雨是引发山洪的主要原因。降水预测是预防山洪及给出解决措施的重要方式。近些年,我国正致力于西部大开发,做好该地的长期降雨预报无疑为国家制定长远的开发政策、发展当地的经济及旅游业等提供了一个好的依据。

施行健等人提出的TrajGRU网络可以动态学习网络递归结构,这种轨迹GRU在sythetic MovingMNIST++数据集和HKO- 7基准上都比ConvGRU效果好的。Shi等人将CNN嵌入RNN模块中,提出了卷积LSTM,提高了预测时间长度,但无法保持细节。Jason Hickey在降水短时预测问题上提出了基于机器学习模型的新研究,该模型主要是对未来短时间内的天气进行高度局部化的「非物理」预测,该方法虽然还处于早期发展阶段,但已经优于传统模型。

常规的预报手段[1-5]过于繁琐、周期性长,天气状况的突变使得预测不够准确。近些年来发展的深度神经网络[6-7]建立在这样一个假设之上:通过使用许多观察样本来填充一个超参数化的网络,可以学习所需的进化规律。然而,在实践中,获取大量的训练样本并不总是可行的。因此,我们考虑一种不同的方法:序列张量补全(STC)。它是从一个序列结构的采样项中恢复潜在的张量,可以任意分配缺失项的位置,无缝地将时间序列的未来值集成到缺失数据的框架中,进而可以引申到视频帧的预测、图像缺失部分的预测。

1 本文算法及思路

传统的降雨预测方法对降雨频繁的西南地区的预测效果微乎其微。图1所示为四川自贡地区某天部分地区的真实降雨情况。可以看出,真实降雨较为分散且稀少,而SCMOC、SPCC的权威预测为大片降雨且广泛。并且在权威方法的预测数据中显示,经常有预测不到的地区,以及某些时段未被预测到。因此,本文采用一种基于张量补全[8]的方法来对未采集到的地区及时段来进行预测。根据由二阶张量组成的序列,进行数据建模成三阶张量来进行对序列的补全及预测,如图2所示。

(a) GT(真实降雨) (b) SCMOC (c) SPCC图1 某地区真实降雨情况

图2 对二阶张量的序列进行数据建模为三阶张量

1.1 卷积核范数[9]

(离散)卷积的概念是信号处理中最基本的概念,它的定义具有多种变体,具体取决于所使用的边界条件。当n=1时,即将X∈Rm和K∈Rk(k≤m)转换为X×K∈Rm的循环卷积过程:

所谓的边界条件是指假定对于i≤s情况下,[X]i-s=[X]i-s+m。

假定k≤m,较小的张量K称为内核,卷积运算是线性的,可以转换为矩阵乘法:

X×K=Ak(X)K∀X,K

式中:Ak(X)是张量的卷积矩阵,卷积矩阵始终与某个内核大小k相关联。根据循环卷积,向量X=[x1,x2,…,xm]T的卷积矩阵是尺寸为m×k的截断循环矩阵:

在k=m的特殊情况中,卷积矩阵Am(X)实际上是一个m×m的循环矩阵。在n≥1的n阶张量的一般情况下,假设X∈Rm1×m2×…×mn和K∈Rk1×k2×…×kn是两个实数值n阶张量,其中kj≤mj,∀1≤j≤n且K叫做内核。将X和K循环卷积为X×K∈Rm1×m2×…×mn的过程:

上述卷积过程可以转化为矩阵乘积,设vec(·)为张量的向量化,于是得到:

vec(X×K)=Ak(X)vec(K) ∀X,K

(1)

为了获得更好的数据恢复效果,进一步提出了卷积核范数。卷积核范数的定义是张量的卷积特征值[10]总和,由式(1)中给出的关系,卷积特征值确实只不过是卷积矩阵的奇异值,因此所谓的卷积核范数正是卷积矩阵的核范数:

1.2 CNNM-NC

卷积核范数最小化[9](Convolution Nuclear Norm Minimization,CNNM)是卷积核范数衍生的一种方法,称作卷积核范数最小化,通过解决以下凸优化问题以完成张量补全:

(2)

CNNM是一般的情况,实际上等同于将CNNM中的内核大小设置为和目标L0一样。根据数据结构选择合适的内核大小,在恢复精度上,CNNM表现得比一些特殊情况要好。CNNM保证了恢复目标L0的精度,只要L0在某些频域中具有稀疏(或近于稀疏)表征即可。实际上,CNNM的理论是对一般情况的概括,能够解释为什么控制内核的大小可能会有效果。式(2)中的优化问题是凸的,并且能够通过ADMM[11-12]来解决。

但是降雨情况得到的数据一般为非负数值,CNNM算法虽然能得到较好的预测效果,但是预测到的结果会有负值产生,因此本文提出非负约束的卷积核范数最小化(CNNM-NC):

s.t.Lij≥0

求解后得到:

1.3 DFTL1-NC

基于L1范数的离散傅里叶变换(DFTL1[9])是CNNM的一种特殊情况,记M∈Rm1×m2×…×mn是由某些时间张量值序列形成的n阶数据张量,记L0∈Rm1×m2×…×mn为满足一些正则条件的潜在张量,且L0≈M。假设给定M中条目的子集和采样集Ω∈{1,2,…,m1}×{1,2,…,m2}×…×{1,2,…,mn}组成观察到的条目的位置。

给定一个观测集合,DFTL1试图通过寻找张量来恢复L0,这个张量不仅具有最稀疏的傅里叶表示法,而且能够最小化观测项的平方损失:

(3)

同理,降雨情况得到的数据一般为非负数值,DFTL1预测到的结果也会有负值产生,因此本文提出非负约束的基于L1范数的离散傅里叶变换(DFTL1-NC):

s.t.Lij≥0

求解后得到:

当L≥0时,L=(λΡΩ+τσ*σ)-1(σ*(τZ-Y)+λΡΩ(M));当L<0时,L=0。

尽管DFTL1和DFTL1-NC在理论上和计算上都是有效的,但是它的缺点就是在张量的每个方向上都是被同等对待的。当这种方法应用于异构数据,比如图像和视频的时候,会产生不期望得到的伪像。

1.4 DFT和卷积之间的联系

每当内核K具有和张量X相同的大小,即kj=mj,∀1≤j≤n,生成的卷积矩阵Am(X)将通过DFT对角化。n=1和n=2的情况是众所周知的,并且在文献中已广泛应用[13-14],其结论适用于n≥1的情况[15]。

准确来说,令X的DFT为σ(X)=X×1U1…×nUn,其中U=U1⊗U2⊗…⊗Un,⊗为Kronecker乘积。UAm(X)UH是一个对角矩阵,UAm(X)UH=mΣ,其中Σ=diag(ρ1,ρ2,…,ρm)。可以得到:

vec(σ(X))=Uvec(σX)=U[Am(X)]:,1=[UAm(X)]:,1=[ΣU]:,1=[ρ1,ρ2,…,ρm]T

卷积矩阵Am(X)的特征值实际是由σ(X)给出的傅里叶频率。因此,对任何X∈Rm1×m2×…×mn,可以得到:

(4)

λ>0是超参数。尽管是实值且凸的,但上述问题很难以可伸缩的方式解决。因此,式(4)仅用于理论分析的目的。最重要的是,DFTL1与LRMC有着紧密的联系。DFTL1的核心是从矩阵条目的子集中恢复低秩矩阵Am(L0)∈Rm×m的方法。

值得注意的是,在kj≤mj的一般情况下,卷积矩阵Ak(X)是一个高矩阵而不是平方。但是,此类卷积矩阵无法通过DFT对角化。

2 实 验

本文采用的数据为四川自贡地区2018年10月—2019年3月期间,每日每隔三个小时,共8个时段每天的降雨分布情况。数据大小为229×170,数据来源中国气象网站,序列控制良好。采用的数据大小为截取出的50×50区域,共截取两个区域,区域1为行60~110、列59~109的区域,区域2为行0~50,列179~229的区域2。

取数据集中若干段,每段八天共64个时间段,用前七天56个连续的时间段来预测最后一天8个连续的时间段的降雨分布情况,并将实验结果与SCMOC、SPCC作比较。

本文采用均方误差(MSE)与结构相似度(SSIM)作为评价指标分,实验环境为Intel(R) Xeon(R) CPU,256 GB内存的E5- 2660 v3 @ 2.60 GHz服务器,使用MATLAB R2016b平台对实验进行编程实现。

2.1 部分实验结果可视化

实验结果如图3、图4所示。

图3 区域1的2019年1月25日的8个时段预测效果图

图4 区域2的2018年12月3日的8个时段预测效果图

2.2 实验总结

除了上述的部分可视化结果外,本文通过均方误差和结构相似度两项评价指标对实验效果进行评估,完整的结果通过表1、表2展示出来,表格中的数据对应上文的连续八个时段的预测图。

表1 区域12019年1月25日的MSE(均方误差)、SSIM(结构相似度)实验结果对比

表2 区域22018年12月3日的MSE(均方误差)、SSIM(结构相似度)实验结果对比

表中均方误差(MSE)是指参数估计值与参数真值之差平方的期望值,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度,一般用来检测预测值与真实值之间的偏差,其计算如式(5)所示。

(5)

结构相似度(SSIM)是评价图像的一个常用标准,是一种衡量两幅图像相似程度的指标,其计算如式(6)所示。

(6)

根据实验结果表明,CNNM-NC在大多数时段的预测效果比SPCC、SCMOC的效果要好,而DFTL1-NC的表现效果较差,这是由于在用于异构数据时,会产生伪像数据。因此采用基于张量补全的CNNM-NC方法,可以得到较好预测效果。

3 结 语

本文采用的CNNM-NC方法,相较于权威的中央气象台的预报指导产品(SCMOC)和各省的订正预报产品(SPCC)两种方法得到较好的预测效果,降雨预测可以转化为可识别性的未来看不见的问题。本文采用的CNNM-NC方法,对于无降雨的预测精确率极高,对于有降雨的预测相较于权威的SCMOC、SPPC方法效果较好。虽然实验主要集中于短时间序列,但是采用的DFTL1-NC和CNNM-NC本质上是基于张量补全的方法,在长时间序列中应该也可以得到较为准确的预测结果,且CNNM-NC在一般情况下的数据预测情况是优于DFTL1-NC的,因此可以投入更广泛的使用。

猜你喜欢
降雨卷积矩阵
基于全卷积神经网络的猪背膘厚快速准确测定
基于FPGA的卷积神经网络加速优化方法
基于图像处理与卷积神经网络的零件识别
降雨型滑坡经验性降雨型阈值研究(以乐清市为例)
基于深度卷积网络与空洞卷积融合的人群计数
多项式理论在矩阵求逆中的应用
泥石流
矩阵
矩阵
矩阵