基于虚拟样本和LSTM 模型的输油管道运行电耗预测研究

2023-10-23 05:55李光
石油石化节能 2023年10期
关键词:输量电耗管道

李光

(大庆油田有限责任公司第七采油厂)

我国多为中质、重质含蜡原油,在管输过程中,集输压降较大。平均压降每增加1 MPa,每公里的电耗约增加300×104kWh/a,因此对输油管道的运行电耗进行有效预测,可以随时掌握能耗的变化情况,以便实时调整开泵方案及输油计划[1]。

对于输油管道运行电耗的预测方法,传统模型包括工艺计算法和数据统计法[2-3]。工艺计算法是在考虑输量、高程、温度、压力的条件下,利用水力学公式计算所需电耗,但该方法易受外界噪声的影响,且通常计算结果与现场实际差距较大,需要不断的变更模型参数,模型适用性不高;数据统计法是在收集现有数据的基础上,通过最小二乘法或灰色模型对数据进行非线性逼近,属于近似模型,其可解释性较差,对于样本数据的质量要求也存在一定要求。随着计算机和人工智能的发展,越来越多的机器学习算法被应用于时序数据预测中[4-5]。李雨等[6]采用粒子群算法优化神经网络模型对原油管道的电耗进行了预测,并与其余几种模型进行了对比;朱振宇等[7]利用分解-优化-预测的思想,采用支持向量机实现了电耗的有效预测;Zeng 等[8]利用神经网络模型实现了管道电耗的短期预测。以上研究未考虑训练样本的数量和质量,也未对输入数据的特征参数进行有效识别,容易引起后续预测模型的过拟合或欠拟合。基于此,在收集影响运行电耗参数的基础上,利用Spearman 相关系数筛选主控因素,随后统计样本的概率密度分布,利用超拉丁立方抽样形成虚拟样本,最后将样本代入长短期记忆网络(LSTM)模型中进行训练及预测。

1 影响因素分析

根据管道特性方程,输油管道的运行电耗与沿程压降呈正比,压降由克服地形高差所需的位能、沿程摩阻和局部摩阻有关,其影响因素包括油品物性、环境特征、管道参数和运行参数等[9-11],其中原油物性包括介质黏度、密度、比热容、凝点、蜡含量、胶质含量等,但这部分参数在管输过程中很难获取;环境参数包括地温、土壤导热性、埋深、天气类型、环境温度等,其中地温影响沿程温降,进而影响总传热系数和管输压降;管道参数包括管径、长度、壁厚等参数,这部分参数通常在投产时就已经确定;运行参数包括输量、进泵压力、出泵压力、下站进压、加热炉出口温度、下站进温等,这些参数均为实时变化,且与运行电耗密不可分。综上所述,选择运行参数和地温作为影响因素,通过Spearman 相关系数分析不同因素之间的相关性。

某原油管道全长125.4 km,共有5 座站场,2 个热站和3 个热泵合建站。管径ϕ406.4 mm×8 mm,管材为X60 管线钢,交货状态为PSL 1,输量30×104~50×104t/a,平均埋深1.5~2 m,外壁采用硬质聚氨脂泡沫塑料和高密度聚乙烯层进行防腐保温。管输介质为含水率小于0.5%的净化原油,20 ℃ 密 度 860~870 kg/m3, 50 ℃ 黏 度 为37.5~672.3 mPa·s。选取其中一个热泵站间管道,通过站场SCADA 系统采集数据进行Spearman 相关系数研究,不同影响因素的Spearman 相关系数热图见图1。

图1 不同影响因素的Spearman 相关系数热图Fig.1 Heat map of Spearman's correlation coefficient for different influencing factors

可见电耗与输量、出泵压力的相关性最强,系数分别为0.965、0.914;与下站进压、进泵压力的相关性较强,系数分别为0.679、-0.512;与加热炉出口温度、下站进温及地温的相关性最弱,系数分别为-0.072、-0.128、-0.193。随着输量增大,输油泵机组的能耗增加;出泵压力和下站进压越大,说明泵可提供的有效扬程越大,供能越大,故这些因素与电耗呈正相关。进泵压力越大,说明从上游泵站残余的压能越大,此站需提供的压能越小,故进泵压力与电耗呈负相关。对于温度数据,鉴于运行中需保证下站进温在介质凝点以上,故温度变化较小,对压力和电耗的也影响较小。温度越高,介质黏度越小,流动性越好,压降和电耗越小,温度与电耗呈微弱负相关。

2 虚拟样本生成

虽然智慧管网的推进极大增加了数据库的建立和完善,但对于服役时间较长的管道,受自动化水平、特殊工况、管道泄露及设备故障的影响,可用的有效数据并不多,且这些数据均存在重复性高、多样性差和分布不均衡的缺点。为提高小样本信息的完善性,在现有数据基础上,统计其概率密度分布,生成虚拟样本,以扩充原有数据,增强预测模型泛化能力[12]。

步骤如下:(1) 根据现场数据, 采用Anderson-Darling 检验统计不同因素服从的概率密度类型,AD 统计量越小,说明在相应的显著性水平下,样本服从特定分布的可能性越大;(2)采用最大似然估计法求解概率密度的关键参数,如正态分布的关键参数为均值和方差,均匀分布的关键参数为最小值和最大值;(3)根据关键参数构建对应的分布类型;(4)采用分层抽样技术中的超拉丁立方抽样法抽取该影响因素的随机数,将不同因素的数据随机组合,形成虚拟样本。

选取相关性较强的输量、进泵压力、出泵压力、下站进压作为统计对象,取2022 年2—6 月的SCADA 系统数据,对数据进行检查分析和查漏补缺,去除明显的异常和错误数据,共计得到100 组原始样本,作为后续虚拟样本建模和模型预测的基础。不同因素AD 统计量结果见表1,其中输量符合Gamma 分布,进泵压力、出泵压力符合正态分布,下站压力符合极值分布,利用最大似然估计法得到对应的分布模型分别为G(700,10,1.5)、N(1.65,0.58)、N(6.17,1.21)、M(0.45,0.52)。G 表示Gamma 分布,三个参数分别为尺度、位置和形状;N 表示正态分布,两个参数分别为均值和方差;M 表示极值分布,两个参数分别为众数和位置。

表1 不同因素的AD 统计量结果Tab.1 AD statistics results of different factors

根据超拉丁立方抽样法生成随机数样本,形成500 个虚拟样本,将其代入Pipesim 软件模型中,得到虚拟电耗,最终形成由数个因素和电耗组成的完整虚拟样本数据库,部分虚拟样本数据库见表2。

表2 部分虚拟样本数据库Tab.2 Database of partial virtual sample

虚拟样本需满足适应性和合理性,即生成的虚拟样本是否可以反映原始样本的特征及与工程实际是否一致。 在此, 利用t 分布随机领域嵌入(t-SNE)算法,将原始样本和虚拟样本降维至二维平面上,观察两者包容性。 t-SNE 算法降维后虚拟样本和真实样本的分布状态见图2。

图2中的每个坐标轴代表一个主成分,由于t-SNE算法在数据降维的过程中进行了中心化处理,故所有的样本信息均在中心附近,原始样本在一个较小的范围内,虚拟样本生成了大量与原始样本不同的新样本,原始样本的信息间隔得到有效填充。

3 输油管道运行电耗预测

运行电耗数据与影响因素之间存在复杂的非线性关系,对于这类时间序列数据,可以采用LSTM模型预测。LSTM 模型通过引入一个记忆单元来记录不同时间间隔内的数据,同时利用输入门、遗忘门和输出门调节、记录记忆数据的进出过程,有效解决梯度消散或爆炸问题。

LSTM 模型中隐含层神经元、最大迭代次数和初始学习率直接影响训练效果和泛化能力。先将原始样本作为训练集代入LSTM 模型中,通过试错法确定LSTM 模型的隐含层神经元、最大迭代次数和初始学习率分别为35、0.015、2.225,由此确定模型网络结构为4-35-1;随后在原始样本中加入不同数量的虚拟样本,代入LSTM 模型继续进行模型训练;最后,将2022 年7 月的20 组数据作为测试集, 验证预测效果, 并通过平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和相关系数(R2)直观体现模型效果。引入不同数量虚拟样本的预测效果见图3、引入不同数量虚拟样本的评价指标结果见表3。

图3 引入不同数量虚拟样本的预测效果Fig.3 Prediction effect with different amounts of virtual samples

当只采用原始样本时,2、9、10、14、15、16、19 号样本预测值与实际值的差距较大,整体预测效果较差;加入虚拟样本后,模型的预测效果有所提升,当虚拟样本增加至400 个时,实际值与预测值的吻合性最好,MAE 为0.018 2×104kWh/d、MAPE 为2.79%、R2为0.921 5;当虚拟样本增加至500 个时,预测精度下降,这可能与样本空间中增加更多低输量、越站、停输再启动等特殊工况的数据,部分数据处于离散和边缘位置,造成对稳态工况拟合能力的下降。

4 应用效果

在上述模型的基础上,对管道日运行电耗进行了预测,并结合预测结果对月开泵方案进行了调整,优化前后的应用效果见表4。其中,11—1 月的耗电量逐渐增加,这与环境温度降低,油品黏度增大,所需克服的沿程摩阻增加有关。经过优化后,开泵台数均有不同程度的降低,2023 年2 月虽然开泵台数与优化前一致,但泵的转速和叶轮直径均有所减小,泵效提升,在沿程温降几乎不变的情况下,沿程压降均有不同程度的降低,说明在出站压头更小的工况下,即可完成站间油品输送。按照电费0.6 元/ kWh 核算,单月节约费用1.68 万元~2.04 万元,管道全线共有3 个站,全年可节约运行电费72 万元。

5 结论

1)通过收集整理基础数据,利用Spearman 相关系数确定了影响管道运行电耗的主控因素为输量、进泵压力、出泵压力和下站进压,其中输量、出泵压力、下站进压与电耗呈正相关,进泵压力与电耗呈负相关。

2)利用AD 统计量确定了影响因素服从的概率分布类型,通过超拉丁立方抽样法形成虚拟样本集,虚拟样本生成了大量与原始样本不同的新样本,原始样本的信息间隔得到有效填充。

3)通过LSTM 模型对管道运行电耗进行了训练和预测,当虚拟样本添加400 个时,模型的MAE 为0.018 2×104kWh/d、MAPE 为2.79%、R2为0.921 5,评价指标均为最优。

猜你喜欢
输量电耗管道
降低生料粉磨电耗的解决措施
瞬态工况下湿气管道积液发展规律的模拟研究
海底长距离湿气管线清管流动规律及方案优化
浅析影响选煤厂电耗的因素与对策
上海某高校研究生宿舍空调电耗特性研究
接好煤改气“最后一米”管道
提高长输原油管道输量的措施研究
粗氢管道腐蚀与腐蚀控制
目标电耗优化对某水利泵站的节能改造分析
基于PipePhase软件管道最小输量计算