基于GCN-GRU组合模型的基坑周边管线沉降预测

2023-10-11 12:11秦世伟陆俊宇
关键词:测点管线卷积

秦世伟, 陆俊宇

(上海大学力学与工程科学学院, 上海 200444)

随着社会快速发展,地下深基坑工程项目日益增多.土体力学性质复杂且受力演化是高度非线性过程, 故基坑工程中的围护体系所承受的压力存在较大不确定性[1-2].一旦工程支护结构发生严重变形,可能导致地下工程倒塌甚至人员伤亡; 因此, 对基坑工程支护结构、周边建(构)筑物及周围土体等变形程度进行准确预测具有重要意义.

基于时间序列分析理论的变形预测方法大致分为三类: 参数模型法、传统机器学习法和深度学习法[3].参数模型法主要运用时间序列的历史数据进行统计分析, 根据各变量之间线性关系建模, 然后推测变形发展趋势, 如历史平均法(historical average, HA)、差分自回归移动平均模型(autoregressive integrated moving average, ARIMA)等, 但以上方法没有考虑特征因子间的非线性关系, 实际预测效果不佳.传统的机器学习方法, 如隐马尔可夫模型(hidden Markov model, HMM)、随机森林模型、支持向量机模型(support vector machines, SVM)等, 虽然能够描述序列非线性关系, 但是高度依赖人为处理数据特征, 且只能提取数据的浅层特征, 多步预测的效果不佳.近年来, 深度学习法在时间序列数据的预测上取得良好效果[4-5].深度神经网络是一种由多个感知机组成的非线性映射系统算法, 具有较强的自主学习与适应性学习能力, 能处理各类复杂的非线性问题.国内外学者使用神经网络方法对基坑围护结构及其周边地表、管线的变形进行预测, 取得了优于传统预测方法的结果[6].

目前相关研究多数仅针对单测点进行建模, 未考虑区域中各测点变形之间的相互影响.然而基坑属于三维结构, 部分土层具有流变性, 故基坑变形具有时空效应, 若忽略此类工程状态空间特征得到的预测结果会有一定误差[7]. 学者们通过组合不同特性的神经网络提取时间与空间特征进行建模分析.如Zhang等[8]通过Seq2Seq模型和图卷积网络对空间和时间依赖性进行建模, 提出了交通网络上的多步速度预测深度学习方法; Khodayar等[9]提出可预测短期风速的可扩展图卷积深度学习模型以捕获每个风点的空间特征和时间特征; 李广春等[10]在时间自回归模型基础上引入空间相关性构建模型对大坝变形进行预测分析; Yang等[11]提出了一种改进的空间和时间加权混合回归的时空变形预测方法, 进一步提高了岩土工程变形预测精度.

本文以上海某基坑工程为背景, 根据长期监测得到的基坑周边管线沉降历史数据及其序列演变特性, 将提取序列时间特征的门控循环单元(gate recurrent unit, GRU)与提取复杂拓扑图结构空间特征的图卷积神经网络(graph convolutional network, GCN)相结合, 建立基于GCN-GRU时空关联性的基坑周边管线沉降预测模型, 利用该模型对基坑开挖过程中周边管线沉降点位变形规律进行预测研究, 为相关工程应用提供参考.

1 方法及原理

本文利用神经网络方法在各基坑监测点的不同时间切片中捕获不同测点间的变形相互影响关系.传统卷积神经网络(convolutional neural networks, CNN)会产生大量冗余信息影响数据特征的提取, 且须构造规则分布的平面网格, 而基坑现场监测点位分布不规则, 因此CNN不适用于捕获多测点的空间关联性.本文使用能够处理非欧式空间结构数据的GCN图卷积神经网络提取每个时间切片的空间特征, 并将压缩信息传递到GRU网络中进一步提取时间特征, 最后融入全连接层进行特征整合并输出预测结果.

1.1 图卷积神经网络

1.2 门控循环单元

门控循环单元和长短期记忆神经网络(long short-term memory, LSTM)均是由循环神经网络(recurrent neural network, RNN)改进的变体网络, 它们解决了序列数据中的长依赖和反向传播引起的梯度消失问题.相比于LSTM神经网络的复杂结构形式, GRU神经网络使用更新门替换LSTM中的遗忘门和输入门, 大幅降低了模型计算复杂度, 相同计算效果下更节省时间与计算资源.

图1为GRU神经网络的神经元结构.GRU通过重置门rt=σ(W(r)xt+U(r)ht-1)和更新门zt=σ(W(z)xt+U(z)ht-1)两种门控机制解决传统循环神经网络的长期依赖问题.其中σ表示Sigmoid函数, 输出值限制在[0,1]之间,W(r)和W(z)分别表示对第t个时间步输入向量xt进行线性变换的重置门权重矩阵与更新门权重矩阵,U(r)和U(z)表示对前一时刻隐藏状态ht-1进行线性变换的重置门权重矩阵与更新门权重矩阵.重置门用于控制对前一序列状态信息的忽略程度, 其数值越小代表忽略的信息越多; 更新门用于控制前一序列状态信息传递到当前状态的程度, 其数值越大代表输入的信息越多.单元中当前隐藏状态h′t=tanh(Wxt+rt⊙Uht-1), 其中W和U分别表示对输入向量xt和隐藏状态ht-1的更新门权重矩阵, ⊙表示Hadamard乘积.网络单元输出的隐藏状态ht将保留当前单元的信息并传递到下个单元中, 最终输出的隐藏状态ht=zt⊙ht-1+(1-zt)⊙h′t.

图1 GRU神经网络神经元结构Fig.1 GRU neural network neuron structure

2 GCN-GRU变形预测模型

2.1 模型结构

图2 GCN-GRU模型结构Fig.2 GCN-GRU model structure

2.2 模型预测流程及评价指标

在基于GCN-GRU模型的变形预测流程中, 首先对现场监测数据进行预处理, 数据清洗后划分为训练集、验证集和测试集; 其次将训练集输入GCN-GRU模型中进行网络训练,利用验证集数据在训练过程中动态调整模型的超参数; 最后将测试集输入训练后的模型中测试模型的评价指标是否达标, 否则继续调整模型超参数重新训练直至满足预期效果.

3 工程实例

3.1 工程概况

上海市某建筑结构由主楼及地下室组成, 主楼为商业办公用房, 地下室为车库及设备用房.基坑位于软土地区, 开挖面积约3 060 m2, 围护周长214 m, 开挖深度16.1~17.1 m, 贴边局部深坑16.8~17.6 m, 塔楼局部深坑18.6~19.8 m.基坑围护结构及周边设有大量变形监测点位, 西侧设有一条管线沉降测线, 该测线由北向南依次设有6个监测点R1~R6, 采集时间从2020年7月28日至2021年1月11日, 共168期数据.

3.2 数据预处理和参数设置

图3 基坑周边管线沉降历史数据Fig.3 Historical data of pipeline settlement around the foundation pit

本文基于PyTorch深度学习框架搭建模型.网络第一层为GCN层, 输入为6个节点的一维特征数据; 第二层为GRU层, 设时间滑动窗口为14 d, 隐藏层神经元个数为32; 第三层为线性全连接层, 输入层个数对应上一层维数, 输出层个数为1.为降低模型对超参数的敏感度, 模型优化器选择Adam算法.设初始学习率为0.003, 衰减率为0.9, 批量大小为32, 迭代次数为100.根据各测点相邻且等距分布的空间位置关系, 得到输入预测模型中的邻接矩阵A, 如图4所示.

图4 预测模型的邻接矩阵Fig.4 Adjacency matrix for predicted models

3.3 结果与分析

利用GRU和GCN-GRU模型分别对R2、R4和R6三个沉降点的变形数据进行预测, 以3个测点14 d的沉降数据构建特征矩阵, 然后通过单步和多步计算分别预测未来1 d或3 d的管线沉降量, 预测结果见图5.由图5可知, 3个沉降点的GCN-GRU预测曲线趋势均与GRU预测曲线大致相同, 但GCN-GRU模型增加了对空间特征的提取, 可根据周边点位变化对自身点位变化进行平衡调整, 因此GCN-GRU预测曲线更接近实测值曲线.

图5 GRU和GCN-GRU模型对不同监测点数据的管线沉降量预测结果Fig.5 Prediction results of pipeline settlement from GRU and GCN-GRU models for different monitoring point data

两种模型的预测结果精度对比见表1.由表1结果可知, 相较于GRU模型, GCN-GRU模型在单步预测中对R2、R4和R6测点预测结果的RMSE分别降低了12.7%、35.0%和34.2%, MAPE分别降低了10.8%、37.8%和26.4%, 模型的平均RMSE和MAPE分别降低了27.3%和25.0%; 在多步预测中, 3个测点的RMSE分别降低了32.5%、32.6%和46.4%, MAPE分别降低了35.3%、35.8%和40.7%, 模型的平均RMSE和MAPE降低37.2%和37.3%.多个测点的结果均表明, GCN-GRU模型的预测精度高于GRU模型, 且在多步预测中的优势更为突出.总之, 考虑了时空关联性的GCN-GRU模型以变形数据作为模型输入参数的唯一特征, 在工程实例中取得了较高的预测精度, 可为基坑周边地下管线的沉降变形预测提供更准确的参考.

表1 两种模型预测结果的评价指标对比

猜你喜欢
测点管线卷积
液压支架整机静强度试验及等效应力分析
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于CATIA的汽车测点批量开发的研究与应用
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
夹套管线预制安装
浅谈通信管线工程建设
浅谈通信管线工程建设
低锰管线钢的相变行为
拱坝结构损伤的多测点R/S分析