基于VMD-TCN-GRU 模型的水质预测研究

2024-03-31 05:50项新建许宏辉谢建立丁祎胡海斌郑永平杨斌
人民黄河 2024年3期
关键词:时间序列汾河

项新建 许宏辉 谢建立 丁祎 胡海斌 郑永平 杨斌

摘 要:为充分挖掘水质数据在短时震荡中的变化特征,提升预测模型的精度,提出一种基于VMD(变分模态分解)、TCN(卷积时间神经网络)及GRU(门控循环单元)组成的混合水质预测模型,采用VMD-TCN-GRU 模型对汾河水库出水口高锰酸盐指数进行预测,并与此类研究中常见的SVR(支持向量回归)、LSTM(长短期记忆神经网络)、TCN 和CNN-LSTM(卷积神经网络-长短期记忆神经网络)这4 种模型预测结果对比表明:VMD-TCN-GRU 模型能更好挖掘水质数据在短时震荡过程中的特征信息,提升水质预测精度;VMD-TCN-GRU 模型的MAE(平均绝对误差)、RMSE( 均方根误差) 下降,R2( 确定系数) 提高,其MAE、RMSE、R2 分別为0.055 3、0.071 7、0.935 1;其预测性能优越,预测精度更高且拥有更强的泛化能力,可以应用于汾河水质预测。

关键词:水质预测;混合模型;变分模态分解;卷积时间神经网络;门控循环单元;时间序列;汾河

中图分类号:TV213.4;X524 文献标志码:A doi:10.3969/ j.issn.1000-1379.2024.03.017

引用格式:项新建,许宏辉,谢建立,等.基于VMD-TCN-GRU 模型的水质预测研究[J].人民黄河,2024,46(3):92-97.

近年来,国内外专家学者为掌握未来水质变化趋势,对水体水质预测方法进行了大量研究,并取得了一定研究成果。罗学科等[1] 利用差分自回归移动平均模型(ARIMA)对巢湖水域水质进行了预测,结果显示其预测精度及泛化能力较强。张颖等[2] 基于改进的灰色模型和模糊神经网络预测了太湖流域未来一段时间内水质整体变化。传统的预测方法虽然理论体系成熟、计算简单,但是随着水环境的变化,无法有效处理高差异、对长时间序列依赖性强且非线性关系复杂的水质数据[3] ,而人工神经网络凭借强大的非线性适应性信息处理能力[4] 、能充分逼近任意非线性函数以及泛化能力强[5] 等特点,被广泛应用于水质预测中。Archana 等[6] 将人工神经网络应用于马图拉下游溶解氧预测,取得了较高的预测精度。秦文虎等[7] 利用长短期记忆神经网络(LSTM)预测太湖水质,相较于传统算法效果更好,但单一LSTM 无法满足数据变化时细节特征的挖掘。王军等[8] 将卷积神经网络(CNN)与长短期记忆神经网络相结合,构建的CNN-LSTM 模型相较于单一LSTM 能更有效预测黄河水质。由此可见,神经网络融合模型在水质预测领域具有较大优势,能有效提高预测精度。但是,水环境变化机理复杂,水质数据具有非平稳性,由神经网络直接挖掘非平稳数据在短时震荡中的变化特征并不能达到理想效果[9] ,而现有的水质预测模型大多并未对此进行处理。信号分解法能有效处理数据的非平稳性问题[10] ,因此在水质预测融合模型中可引入信号分解法进行数据前处理,挖掘数据的短时变化特征,以提升融合模型的预测精度。

本文提出一种基于VMD-TCN-GRU 的水质预测模型,以汾河水库出水口水质数据为样本,首先利用VMD(变分模态分解)将非平稳的水质时序数据分解成若干个相对平稳的IMF(本征模态函数),减小模型预测误差;接着将各IMF 输入TCN-GRU(卷积时间神经网络-门控循环单元)中,提取数据的时序特征及数据变化的细节信息,并进行非线性拟合,通过注意力机制让模型聚焦于对水质影响更大的信息;最后将各预测序列线性叠加,重构得到最终的预测结果。此外,使用WOA(鲸鱼算法)对VMD 以及预测网络中的关键参数寻优,减少调参的工作量并提高模型的预测精度。同时,采用对比试验证明VMD-TCN-GRU 模型具有较高的准确性与较强的泛化能力,能极大减小数据非平稳性的干扰。

1 研究方法

1.1 变分模态分解

VMD 是一种新型自适应信号分解方法,能够有效解决EMD(经验模态分解)方法存在的模态分量混叠问题[11] ,极大降低复杂性高的时间序列非平稳性影响,将复杂的非平稳信号分解为包含多个不同频率尺度且相对平稳的子序列,从而提高其稳定性。VMD 处理非平稳性严重的时间序列数据时,其分解性能受模态个数k 与惩罚因子α 设置的影响[12] 。

1.2 卷积时间神经网络

TCN 是CNN(卷积神经网络)的一种改进形式,由因果卷积、扩张卷积以及残差模块组成,能有效处理时序问题。因果卷积保证了数据被提取特征信息时的因果时序性;扩张卷积允许对卷积输入进行间隔采样,使神经元对更广泛区域的输入数据产生响应,有利于TCN 抓取更长的时序依赖关系;残差模块则用来缓解梯度不稳定问题,解决因网络深度增加而带来的干扰,提高模型预测的精度。其中扩张卷积计算公式为

1.4 模型构建

1.4.1 VMD-TCN-GRU 的构建

水质数据随时间变化的非平稳性、非线性特征明显。因此,使用VMD 对数据进行处理,将其分解为多个相对平稳的子序列。接着,将TCN 与GRU 进行结合,先利用TCN 对水质数据在时间维度上的特征信息及变化的细节信息进行挖掘,充分学习数据之间的关联性,再将得到的特征信息作为GRU 的输入,进一步提取输入序列的特征并进行非线性拟合。同时,针对长时间序列数据处理时难以把握信息重要程度的问题,在GRU 基础上引入注意力机制,让模型聚焦于对水质预测更重要的特征信息。TCN-GRU 预测模型结构见图2(其中:Dropout 是常用的正则化方法,用于减少神经网络过拟合现象;Dense 全连接层可以将输入特征映射到输出结果)。

1.4.2 VMD-TCN-GRU 运行流程

设置合适的模态参数k 与惩罚因子α 对VMD 的分解至关重要,同时神经网络模型中某些关键参数取值影响预测结果,为优化相关参数并减小人为经验调参的影响,利用WOA 算法[14] 将模态个数k 和惩罚因子α、第一层GRU 隐藏层单元数、第二层GRU 隐藏层单元数、Dropout 数以及批处理大小作为寻优变量,寻找全局最优解。引入WOA 算法后,模型运行主要流程如下。

1)对优化VMD 的WOA 算法进行初始化,设置WOA 算法相关参数(鲸鱼数量、鲸鱼维度以及迭代次数),将平均包络熵作为优化VMD 时的适应度函数,其中平均包络熵计算公式为

2 研究概况与数据来源

汾河是黄河第二大支流,位于山西省中部与西南部,全长716 km,流域面积约39 721 km2,占全省面积的25.5%[15] 。汾河支流众多,其中较大的有潇河、文峪河、浍河等。研究所采用数据来源于中国环境监测总站,其每4 h 发布一次水质数据。选取水质监测断面为汾河水库出水口,将其2021 年1 月1 日0 时至2022 年6 月30 日20 时共3 276 条水质数据作为样本。根据国家地表水水质自动监测站水质评价指标,选取pH 值、溶解氧、高锰酸盐指数、氨氮、总磷等5 类水质因子进行分析,将《地表水环境质量标准》(GB3838—2002)与获取的水质数据进行对比发现,高锰酸盐指数对该断面水质类别影响最大,因此本研究将高锰酸盐指数作为主要水质指标进行研究。

3 试验结果与分析

3.1 缺失数据处理

在数据获取过程中,存在系统或人为因素导致部分数据缺失的问题。为保障试验的有效性,采用线性插值法处理缺失数据。缺失数据补齐后,将数据集按9 ∶ 1 的比例划分训练集与测试集,补缺后的高锰酸盐指数变化情况见图4。据图4 可知,高锰酸盐指数数据随时间变化具有非线性、非平稳性特点。

3.2 模型评价

为合理评估模型的预测效果,采用平均绝对误差(MAE)、均方根误差(RMSE)以及确定系数(R2 )对预测结果进行评价。其中:MAE 可以反映预测结果与实测值偏差绝对值的平均数,MAE 值越小表示预测结果与实测值越吻合,MAE 值越大表示预测结果误差越大;RMSE 可以衡量预测结果与实测值之间的偏差,RMSE 越接近0 表明模型越稳定,RMSE 越大表明模型稳定性越差;R2 可以反映模型拟合数据的准确度,其范围为0~1,R2越接近1 表明模型拟合能力越好,R2越接近0 表明模型拟合能力越差。

3.3 试验主要参数设置

模型训练过程中所使用的优化器为Adam,学习率设置为0.001,激活函数设置为ReLU,滑动窗口大小为22。TCN 时间特征提取部分,残差单元为2,卷积核数设置为32、16,卷积核尺寸为3,扩张因子数量设为1、2、4、8;全连接层1 神经元数量设置为32,全连接层2神经元数量设置为1。WOA 优化VMD 主要参数设置:惩罚因子范围为[100,7 000],噪声容限tau 为0,分解IMF 个数k 范围为[3,12],直流分量DC 为0,模态中心频率初始化值init 为1,控制误差大小常量tol为1×10-7;WOA 算法1 鲸鱼数量、迭代次数、鲸鱼维度分别为60、80、2,WOA 算法2 鲸鱼数量、迭代次数、鲸鱼维度分别为5、5、4。WOA 优化神经网络部分参数设置见表1。

3.4 结果分析

3.4.1 VMD 非平稳序列分解

通过WOA 算法1 对VMD 中设置的惩罚因子与模态个数进行全局寻优,解得惩罚因子为478,模态个数为4。因此,VMD 将原始高锰酸盐指数数据分解成4 个IMF,见图5。模态分量IMF1 表示趋势分量,反映高锰酸盐指数随时间变化的整体趋势;模态分量IMF2表示细节分量,反映高锰酸盐指数随时间变化的细节差异;模态分量IMF3 与IMF4 表示随机分量,反映高锰酸盐指数随时间变化的随机性。而VMD 分解后的各模态分量虽然存在一定范围的波动,但整体上较为稳定,IMF2、IMF3、IMF4 的分量值皆均匀分布于0 的两侧,可以有效降低后续模型预测的误差。

经计算可得模态分量IMF1、IMF2、IMF3、IMF4 的过零率分别为0、0.111 7、0.343 7、0.678 2。IMF1 的过零率小于0.05,将其作为低频分量,IMF2、IMF3、IMF4作为高频分量。结合图5 可知,低频分量更能体现数据的整体变化趋势,高频分量则体现了数据在一定时间内的震荡变化。由此可见,原始数据经VMD 分解为低频到高频的4 个分量,虽然数据量增加,但其平稳性有了很大改善,同时找出了高锰酸盐指数在短时震荡过程中所隐藏的波动趋势,有利于模型更好地挖掘数据的变化规律。

3.4.2 VMD-TCN-GRU 模型的效果验证

为验证VMD-TCN-GRU 水质预测模型的性能,使用相同的数据集,将本文模型与常见的传统机器学习预测模型SVR(支持向量回归)及当下较流行的预测模型LSTM、TCN、CNN-LSTM 试验结果进行对比。此外,为验证VMD、注意力机制以及WOA 算法( 以TCN-GRU预测模型为例)对本文模型预测性能的影响,使用相同的数据集进行消融试验。

1)对比试验。将分解好的各IMF 按9 ∶ 1 的比例划分为训练集和测试集,将各IMF 的训练集分别输入TCN-GRU 预测模型中迭代训练,并预测其对应的测试集,将输出的4 个预测序列重构得到最终的预测结果。各模型拟合结果见图6,由图6 可以看出,相较于其他模型,VMD-TCN-GRU 水质预测模型预测曲线拟合程度最高,其他模型的预测曲线虽与实测曲线在大致趋势上贴合,但这些模型在数据的短时波动变化上的处理效果不佳,尤其是LSTM 模型。

SVR 预测曲线与实测曲线的贴合程度不如本文研究模型,由此可见,传统的机器学习预测模型对非平稳时序数据的预测效果欠佳;LSTM 虽在预测中能与实测曲线保持趋势上一致,但无法挖掘数据在短时震荡过程中的信息;CNN-LSTM 模型的預测曲线相较于实测曲线,存在一定程度偏移,其原因是未对输入的非平稳数据进行前处理;TCN 虽然能挖掘序列数据在时间维度上的特征信息,但其无法充分提取非平稳输入数据中的波动趋势信息,因此其拟合效果弱于本文研究模型。

此外,通过MAE、RMSE 和R2 这3 个评价指标对各模型的预测性能进行量化评估,不同模型预测性能对比见表2。相较于其他模型,本文研究所提出的VMD-TCN-GRU 模型在各评价指标上均具有明显优势,表明在汾河水质预测上VMD-TCN-GRU 模型相较于传统水质预测模型及当下较流行的水质预测模型,预测精度更高且泛化能力更强,可以应用于汾河水质预测。

2) 消融试验。将去掉VMD、注意力机制以及WOA 算法后的模型与原模型进行消融试验,不同模型消融试验预测结果见图7,消融试验中量化的预测性能评价指标对比见表3。未加入VMD、WOA 算法及注意力机制的模型预测效果对45°拟合线的贴合程度均弱于本文模型,并可直观看出VMD 对模型的预测效果影响最大,去掉VMD 模型的预测值较大程度偏离实测值,即预测值与实测值关系点较多远离45°线。

同时结合表3 可知,在引入WOA 算法后,模型能自适应参数寻优,得到最优解,有效减少人为经验调参的干扰,其MAE 与RMSE 分别降低了34.86%和31.52%,R2提高了8.51%;而加入注意力机制后,预测模型能聚焦重要程度更高的特征,其MAE 与RMSE 分别降低了32.48%和28.37%,R2提高了7.04%;此外经过VMD 处理,高锰酸盐指数数据的平稳性得到大幅提升,有效减小了后续预测的误差,其MAE 与RMSE 分别降低了50.89%和53.80%,R2提高了34.31%。综上可知,VMD模块、WOA 优化算法以及注意力机制的引入能提高模型的预测精度。

4 结论

为提高水质预测精度,针对水质数据随时间变化的非平稳性、非线性特征,提出了基于VMD-TCNGRU的水质预测模型,并在GRU 模型基礎上引入注意力机制,让模型聚焦于对水质预测更重要的特征信息,同时使用WOA 对VMD 以及预测网络中的关键参数进行寻优,减少调参的工作量,提高模型的预测精度。通过VMD 数据分解法对水质数据进行前处理,从而得到若干个特征性强且相对平稳的IMF,有利于后续预测模型充分挖掘数据在短时震荡过程中的波动变化趋势及细节特征,从而大幅提升水质预测精度。相较于其他模型,VMD-TCN-GRU 模型能更好地挖掘水质数据在短时震荡过程中的特征信息,找到其实际变化规律,并让模型得到充分学习,进而提升水质预测的精度,采用VMD-TCN-GRU 模型对汾河水库出水口高锰酸盐指数进行预测,其MAE 为0.055 3,RMSE 为0.071 7,R2为0.935 1,预测精度高,可以应用于汾河水质预测工作中。

参考文献:

[1] 罗学科,何云霄,刘鹏,等.ARIMA-SVR 组合方法在水质预测中的应用[J].长江科学院院报,2020,37(10):21-27.

[2] 张颖,高倩倩.基于灰色模型和模糊神经网络的综合水质预测模型研究[J].环境工程学报,2015,9(2):537-545.

[3] 曹文治,苏雅,曾阳艳,等.基于EEMD-LSTM-SVR 的水质预测模型[J].系统工程,2023,41(4):1-12.

[4] 郭庆春,何振芳,李力.人工神经网络模型在黄河水质预测中的应用[J].人民黄河,2011,33(10):42-43.

[5] 梁冰,田斌,洪汉玉.基于LSTM-Attention 的水质参数预测研究[J].自动化与仪表,2022,37(3):80-84.

[6] ARCHANA Sarkar,PRASHANT Pandey.River Water QualityModelling Using Artificial Neural Network Technique[J].A?quatic Procedia,2015,4(C):1070-1077.

[7] 秦文虎,陈溪莹.基于长短时记忆网络的水质预测模型研究[J].安全与环境学报,2020,20(1):328-334.

[8] 王军,高梓勋,朱永明.基于CNN-LSTM 模型的黄河水质预测研究[J].人民黄河,2021,43(5):96-99,109.

[9] 董泳,刘肖峰,李云波,等.基于EMD-EEMD-LSTM 的大坝变形预测模型[ J]. 水力发电,2022,48 (10):68 -71,112.

[10] 夏骏达,郑伟伦,王子涵,等.基于EMD-LSTM 的船舶运动姿态短期预测[J].计算机与数字工程,2022,50(7):1434-1438.

[11] 祁继霞,粟晓玲,张更喜,等.VMD-LSTM 模型对不同预见期月径流的预测研究[J].干旱地区农业研究,2022,40(6):258-267.

[12] 戚庭野,卫会汝,冯国瑞,等.基于WOA-VMD 的瞬变电磁探测信号降噪方法[J].中南大学学报(自然科学版),2021,52(11):3885-3898.

[13] 邹可可,李中原,穆小玲,等.基于LSTM-GRU 的污水水质预测模型研究[J].能源与环保,2021,43(12):59-63.

[14] 万俊杰,单鸿涛.基于WOA 优化LSTM 神经网络的配电网可靠性评估[J].智能计算机与应用,2021,11(10):107-112,117.

[15] 李天悦,李家存,王艳慧,等.近25 年来汾河流域土地利用及景观格局变化研究[J].首都师范大学学报(自然科学版),2023,44(3):48-55.

【责任编辑 吕艳梅】

猜你喜欢
时间序列汾河
陪汾河走一走
一图读懂《山西省汾河保护条例》
汾河水韵
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测
依托百里汾河工程构建体育健身绿道的思考
汾河流域生态修复核心区建设