基于数据知识融合的输电线路线损计算方法及算例分析

2023-10-16 08:50于建林张虎林
中国新技术新产品 2023年17期
关键词:计算方法时序杆塔

于建林 张虎林

(甘肃蓝野建设监理有限公司,甘肃 兰州 743000)

1 输电线路线损理论计算误差成因分析

输电线路的线损由2 个部分构成,其一是线路实际电能损耗,其二是计量误差。线路实际损耗可通过理论计算来确认,如计算地线损耗、电晕损耗和电阻损耗[1]。计量误差来自比值误差、粗大数据误差和相角误差等。然而,线路实际损耗的影响因素较复杂,部分损耗难以通过理论方法进行计算,例如地形变化、线路老化、导线相序差异以及天气因素等可造成一定的线损,但相关数据难以统计。理论计算方法能够较准确地反映出新投用线路的线损,随着时间的延长,理论线损与实际线损的偏差会有所增大,根据现有的研究成果,该偏差可达5%~10%。因此,应该改进现有的线损计算方法。

2 基于数据知识融合的输电线路线损计模型构建

2.1 基于数据知识融合的BOA-GBDT 线损计算方法建模

2.1.1 数据知识融合

电阻、电晕和地线造成的损耗是线路实际电能损耗的主要来源,因此线损理论计算结果决定了线损的平均趋势。非理论影响因素具有一定的随机性,导致线损在理论计算平均趋势的基础上发生随机波动。数据知识融合要求在线损计算中合并理论影响因素和非理论影响因素,利用大数据生成随时间变化的数据特征,融合过程如图1所示。

图1 数据知识融合路径

2.1.2 BOA-GBDT 线损计算模型

梯度提升树(Gradient Boosting Decision Tree,GBDT)属于机器学习方法,由多个决策树集成而来,用于数据分类或者回归,可将GBDT 作为输电线路线损计算的建模基础。贝叶斯优化算法(Bayesian Optimization Algorithm,BOA)可用于优化线损计算模型中的参数。该文研究融合了BOA 算法和GBDT 算法,构建了BOAGBDT 算法模型,将经过融合的输电线路运行数据作为BOA-GBDT 模型的输入参数,再经过训练、优化,形成更精确的线损计算模型,其实施过程如图2所示。

图2 BOA-GBDT 模型

2.2 输电线路多维异构数据预处理

2.2.1 数据来源

线路杆塔数据、气象数据、电能数据以及潮流数据等构成了输电线路的主要运行数据,部分数据与时间存在紧密的联系,因此称为时序数据,典型的如电能数据。将输电系统的真实运行数据作为模型训练的数据来源,显然,不同类型的数据在结构上存在差异,需要进行预处理,以便提高模型训练的效率。

2.2.2 数据预处理

2.2.2.1 提取日电量数据

电流互感器能够计量输电线路中的正反向有功电能,计量维度可精确到每条线路,计数方式为累计计数,因此不能直接读取每日的电量,可根据公式(1)提取日电量数据。

式中:Mt-1为电流互感器在第t-1日的累计计量值;Mt为在第t日的累计计量值;Vt为第t日的日电量;β为电流互感器的倍率值记。

2.2.2.2 数据颗粒度同化

电流互感器数据按日计量,潮流数据每分钟计量一次,气象数据每小时采集一次,由此会造成数据的时间粒度不统一,需要对其进行时间颗粒度同化。3种数据的最大时间粒度为日,因此潮流数据和气象数据也要转化为按日采集。潮流数据按日采集的方法为求取当日所有数据的平均值。气象数据涵盖温度、气压、降水量和风力等,其数据颗粒度同化的方式有所差异[2]。例如温度数据可取当日的极值,在高温天取最高温度,在严寒日取最低温度。再如,风力数据可取当日的平均值。

2.2.2.3 异常线损数据清洗

原始数据中有可能存在粗大数值,能够干扰模型训练的效果,因此需要进行数据清洗,剔除不合理的数据点。判断粗大误差时采用拉依达准则,其原理为求得线损数据的标准差,设置合理的数据偏差范围(标准差3 倍以内),将超过合理范围的数据视作粗大误差,具体实施过程如下。

假设线损数据为等精度的独立有限测量序列,将其记为Y,则有Y={y(k)|k=1,2,...,n}。该测量序列的算数平均值和残余误差分别为yavg、gk,标准差σ的计算方法与yavg、gk有关,具体如公式(2)~公式(4)所示。

式中:gk为线损数据y(k)的剩余误差。

如果|gk|>3σ,说明数据y(k)超过合理范围,属于粗大误差。

2.2.3 输电线路线损非理论影响因素特征提取

线损非理论影响因素缺乏理论模型,难以直接计算,因此引入大数据方法对其进行分析,提取非理论影响因素的数据特征是进行模型训练的前提[3]。根据数据知识融合的路径,线损历史数据、输电线路杆塔数据、潮流数据以及气象数据具有不同的特征提取方式。

2.2.3.1 提取线损历史数据的EWMA 特征

指数加权移动平均值特征(Exponentially Weighted Moving Average,EWMA)能反映中短期时间序列的发展趋势,通常而言,近期的历史数据在趋势预测中具有更强的参考价值,因此对其设置更高的权重。更早的历史数据对未来的预测效果相对较差,因此降低其权重,以提高趋势预测的准确性,EWMA 特征提取方法如下。

假设任一输电线路的日线损数据序列集合为L,其中存在n个序列样本,lj为集合L中的一个元素,则有j∈[0,n]。将该线路在第i天的线损EWMA 特征记为ei,则ei的计算方法如公式(5)所示。

式中:α为平滑参数记,并且α∈(0,1];li为线路在第i天的线损数据;li-1为线路在第i-1 天的线损数据;en为线路在第n天的EWMA 特征。

参数α的取值根据公式(6)进行计算。

2.2.3.2 提取时序数据的曲线特征

输电线路相关的时序数据主要包括潮流数据和气象数据,用于精确描述输电线路的工况。时序数据具体又可细分为有功功率、无功功率、降雨量、环境温度、输电电压、输电电流以及风速等。曲线特征包括多种数据指标,其平均值反映时序数据的平均趋势,最大值和最小值描述了时序数据的极值,平均差值体现出不同时序数据的变化趋势[4]。将时序数据的线损影响量记为V,观察时窗记为w(7 天为一个观察时窗),vw i表示时序影响因素在时窗w内的第i天所引起的线损时序影响数据,特征曲线的平均值和平均差值分别记为Vmean、Vmean_diff,则有公式(7)、公式(8)。

式中:vw i-1为时序影响因素在时窗内第i-1 天的线损时序影响数据。

2.2.3.3 提取输电线路杆塔特征

杆塔特征属于线路本体信息,与之类似的信息包括输电线路的电压等级、相序和线路的投运时间等,线路特征集中体现于线路本体信息中的固定信息。数值类信息是每基杆塔的基本信息,不同杆塔的数值类信息存在一定差异,对线损计算的应用价值相对较低。因此将杆塔特征作为线路的本体信息,杆塔特征按照如下方法进行提取:1)杆塔的数值型信息并不统一,如杆塔线路的呼称高,针对此类信息,将平均值作为杆塔特征的描述方式。2)对杆塔的类别型信息,可利用独热编码进行构造。将杆塔的某一种类别信息记为K,其状态集合为Nk,假设K为第i条输电线路的第j个杆塔的类别信息,K当前处于l 状态,此时对K进行独热编码,则有Kij=[0,0,...,1,...,0][5]。对线路中每个杆塔的对应状态进行求和,即可获取该条线路针对类别信息K的杆塔特征,如公式(9)所示。

式中:将输电线路i上的杆塔数量记为Ntower。按照以上方法,假设某条高压交流输电线路中设计有4 个杆塔,高压线采用三相三线制,则相序存在6 种可能,对4 个杆塔的相序进行独热编码,得到的结果见表1,此时可求得该条线路的相序特征,结果为[2,2,0,0,0,0]。

表1 线路杆塔相序特征独热编码示例

2.2.3.4 构建GBDT 线损计算模型

GBDT 线损计算模型以输电线路的理论计算线损和非理论影响量的特征为基础,构建基于数据知识融合的GBDT 模型,根据梯度提升树算法的实现原理,线损计算模型的数学表达式如公式(10)所示。

式中:Zi为该集合中的一个元素,i=1,2,...,N;γ为模型损失函数的参数;f0(Zi)为初始模型;T为模型的迭代次数;Rjt为树模型中的叶子节点;J为叶子节点的总数,则j=1,2,...,J;I为指示函数,I的取值为1 或者0,如果Zi属于叶子节点Rjt,则I=1,否则I=0。

2.2.3.5 BOA-GBDT 线损计算模型构建方法

采用BOA 算法优化上一步建立的GBDT 线损计算模型,以离散随机采样的方式在区间[1,7]内搜索回归树的深度,叶子数量的区间为[2,128],学习率的区间为[0.001,0.5]。利用BOA 算法实现模型优化的步骤为选择初始参数组合样本集、计算样本损失函数的高斯过程、新样本采样、更新样本损失函数的高斯过程、判断是否达到迭代次数直到输出最优样本[6]。

3 算例分析

3.1 数据来源

以国内某城市的真实线路运行数据为模型训练和效果测试的数据源,训练数据的采集时间为2023年1月10日至2023年4月19日,共计100 天。从2023年4月20日开始,再连续采集50 天的运行数据,用于模型检验。

3.2 计算精度分析

为了检验该文所建立模型的效果,为其设置对照组,组1采用传统的理论计算方法,组2 采用BOA-GBDT 线损计算模,分别评估2 种线损计算模型的精确度,将其作为性能对比的依据。精确度的计算方法如公式(11)所示。

式中:Vob为第i个样本的实际线损;Vpre为模型计算线损;M为样本总数量;Ermse为精确度。

相同数据下2 种模型的性能指标测试结果见表2,从中可知,BOA-GBDT 线损计算模型精确度更好。

3.3 模型线损计算的影响量权重分析

模型中不同影响量权重分配的合理性是评价其应用价值的重要考量因素,不同影响量的权重的计算如公式(12)所示。

式中:vi为影响量;Imp(vi)为vi对应的影响权重;vi.10·j为vi位于数据第10·j个百分位的数值;lossmean为日均统计残损值;loss为函数,用于统计线损的理论计算值;mean(x)为影响量x在训练时间内的均值。

2 种模型的影响量权重计算结果见表3,从中可知,和传统的理论计算模型相比,基于数据知识融合的BOA-GBDT 计算模型增加了环境温度、风速和线电压温度的权重,而这3 个影响量均为非理论影响量,说明该模型在线损计算中强化了对非理论影响考量,达到了设计目标。

表2 2 种模型的测试结果

表3 2 种模型的影响量权重计算结果

4 结语

现有的输电线路线损计算方法存在一定缺陷,与实际损失偏差较大,主要原因在于未能充分统计各种非理论因素造成的线损。为了解决该问题,可广泛收集输电线路的基本数据,包括气象数据、潮流数据、杆塔数据以及各种理论线损数据,实现知识数据的广泛融合。再利用GBDT 算法和BOA 算法建立新的计算模型。经过检验,基于数据知识融合的BOAGBDT 模型能够达到预期效果,其线损计算精度明显优于传统的理论计算方法。

猜你喜欢
计算方法时序杆塔
基于北斗的高压输电杆塔智能实时监测技术与应用
基于Sentinel-2时序NDVI的麦冬识别研究
基于ZigBee与GPRS的输电杆塔倾斜监测预警系统
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
随机振动试验包络计算方法
基于粗糙模糊集的输电杆塔塔材实际强度精确计算
不同应变率比值计算方法在甲状腺恶性肿瘤诊断中的应用
一种伺服机构刚度计算方法
DPBUS时序及其设定方法