高速铁路风速监测异常数据判识方法研究

2021-11-08 01:59包云李亚群马祯陈中雷白根亮
铁道建筑 2021年10期
关键词:风向监测数据差分

包云 李亚群 马祯 陈中雷 白根亮

1.中国铁道科学研究院集团有限公司电子计算技术研究所,北京100081;2.北京经纬信息技术有限公司,北京100081

1 高速铁路风监测

风监测报警是为了防御和降低大风对列车运行安全造成的影响。高速铁路灾害监测系统通过在沿线大风重点发生区段(如山区垭口、峡谷、河谷、桥梁、高路堤等区段)设置风监测设备,采集瞬时风速和风向信息。当风速监测值超过报警阈值时进行报警,调度员根据运营管理规则发出行车限速或停车指令。监测设备一般采用超声波式风速风向计。为保证风监测的连续性和稳定性,在同一监测点设置两台风速风向计,安装于轨旁供电接触网支柱上,风速风向计监测面距轨面4 0000-100mm[1]。两台风速风向计同时采集风速、风向信息。监测数据的准确性除定期进行风洞检定外,现场一般较难核查,因此本文研究通过风速监测异常数据的判识提高报警数据的质量。

高速铁路风速监测异常数据的判识可借鉴气象要素质量控制相关方法。地面气象资料质量控制以人机交互辨别的实时检查为主。检查方法包括气候学界限值检查、内部一致性检查、时间一致性检查、空间一致性检查等[2-3]。这些传统的质量控制方法对要素的变化缺乏灵敏性,已经不能满足质量控制需求。随着大数据、人工智能等技术的发展,气象部门也在探索基于数据挖掘的观测数据质量控制方法,如支持向量机、粒子群、神经网络等[4]。本文以福平(福州—平潭)高速铁路风速监测数据为例,基于数据挖掘技术,研究异常数据的判识方法,以进一步提高风速报警的可靠性。

2 高速铁路风速监测数据特征分析

风具有局部、突发等特性,除龙卷风等极端情况外,风速的变化一般具有连续性,见图1。风还具有季节性特点,一般春季(3—5 月)为大风的高发期。因此,可根据风速的连续性特点采用数据挖掘的方法进行异常数据判识。

图1 福平铁路某监测点风速监测数据(2020年10月)

2.1 两台风速风向计异常数据判识

现场监测过程中存在两台风速风向计监测数据差异较大的情况(图2),需要对两台设备监测数据进行判识,以排除异常数据。

图2 两台风速风向计风速监测数据

两台风速风向计安装于同一接触网支柱的同一高度处,监测数据具有相关性,因此采用相关性分析对两台风速风向计异常数据进行判识。相关系数的计算公式为

其中:s1、s2分别为两台风速风向计监测的风速序列;Cov(s1,s2)为风速序列s1,s2的协方差;Var[s1]、Var[s2]分别为风速序列s1和s2的方差。

当相关系数不小于0.95时,认为两台风速风向计监测数据正常,否则需要进行单台风速风向计异常数据判识。

2.2 单台风速风向计异常数据判识

单台风速风向计风速监测数据为秒级时间序列。采用孤立森林法、支持向量机法等机器学习算法对异常数据进行识别,结果见图3。可以看出,孤立森林法将部分风速的极大值判识为异常数据,支持向量机法将部分风速的极大值和极小值识别为异常数据。由于风具有突发特性,这两种机器学习算法对风速异常数据的判识存在误判,因此,采用统计分析方法识别风速异常数据。

图3 两种算法对正常风速监测数据的判识结果

根据对高速铁路风速监测数据的分析,风速一般不符合正态分布,但是瞬时风速差分之后符合正态分布,见图4。因此,采用动态自适应差分阈值法[5-6]进行异常数据判识。

图4 瞬时风速差分前后的分布

福平铁路一监测点风速v监测数据差分结果见图5。可以看出:v<10.8 m/s 时风速差分值在-1.9~1.6 m/s;v≥ 10.8 m/s 时风速差分值在-3.4~3.5 m/s。因此,可将风速分为不同等级,确定不同等级风速下差分阈值。根据当前风速监测数据动态自适应选择差分阈值的区间,进行异常风速的判识。

图5 福平铁路一监测点风速监测数据差分结果

根据风速对列车运行和基础设施的影响,将风速监测数据划分为v <10.8 m/s、10.8 m/s≤v <15.0 m/s、15.0 m/s ≤v <20.0 m/s、20.0 m/s ≤v <25.0 m/s、25.0 m/s ≤v <30.0 m/s、v≥ 30.0 m/s 6 个等级。对各等级风速进行差分得出每个等级风速下的差分阈值。各线路不同等级风速下的差分阈值根据历史数据得出。当前风速差分值超过对应等级风速下的差分阈值时,标记为可疑数据,进行人工判识。

3 风速异常数据原因分析

通过对两台和单台风速风向计风速监测异常数据的分析发现,导致风速监测数据异常的原因有风速风向计故障、随机扰动和环境因素(如接触网支柱遮挡、冻雨等)3种,见图6。其中,红色区数据异常。

图6 风速监测异常数据

4 工程验证

选取京张(北京—张家口)高速铁路2021 年3 月—5 月一个风季的风速、风向监测数据进行分析。京张高速铁路沿线共设置40个风监测点,对各监测点的数据进行预处理,去掉无效数据。被去掉的数据不参与差分阈值计算。

4.1 两台风速风向计风速异常数据判识

对同一监测点两台风速风向计监测数据进行相关性分析,以监测点K149 + 906 和K24 + 408 部分数据分析结果(图7)为例,监测点K149 + 906 两台风速风向计风速相关系数r达到0.976,r>0.95,通过相关性检验,表明两台风速风向计风速监测数据正常。监测点K24 + 408 两台风速风向计风速r为0.003,r<0.95,未通过相关性检验,表明两台风速风向计风速监测数据异常,需要进一步对单台风速风向计风速异常数据进行判识。

图7 两台风速风向计风速相关性判识结果

4.2 单台风速风向计风速异常数据判识

采用动态自适应差分阈值法分别对监测点K24+408 两台风速风向计风速监测数据进行分析。其中一台风速风向计差分阈值设置见表1,可以看出各风速段阈值不同。20.0 m/s ≤v< 25.0 m/s 时阈值较小,是由于样本较少,即一个风季内20.0 m/s 以上的大风较少。该监测点未监测到25.0 m/s以上大风。

表1 差分阈值设置 m·s-1

该风速风向计风速的判识结果见图8。由表1 和图8 可以看出,监测数据在正常的阈值范围内。采用同样的方法对另一台风速风向计进行异常数据判识,风速监测数据也在阈值范围内。这说明现场两台风速风向计风速监测数据差异较大不是由于单台风速风向计故障导致的。

图8 单台风速计异常数据判识结果

对风向数据进行分析,以确定异常数据是否由接触网支柱遮挡所致。将风向监测数据分为4个风向段(0°~ 90°、90°~ 180°、180°~ 270°、270°~ 360°),分析每个风向段内两台风速风向计同一时刻风速监测数据的差值(风速风向计2 监测的风速-风速风向计1 监测的风速)分布,结果见图9。可见:风向为180° ~360°时,两台风速风向计风速监测数据差异较大。当风向为180°~270°,风速风向计2 的风速监测数据大于风速风向计1的情况比较多,两者之间的差值最大达15 m/s以上;当风向为270°~ 360°时,风速风向计2 的风速监测数据小于风速风向计1 的情况比较多,两者之间的差值最大达-15 m/s以上。

图9 两台风速风向计风速差在4个风向段的分布

对风向为180° ~360°的两台风速风向计风速监测数据进一步分析,结果见图10。可见:导致风速风向计2 的风速监测数据大于风速风向计1 的风主要为西南风(风向225°~ 270°);导致风速风向计1 的风速监测数据大于风速风向计2 的风主要为东南风(风向270°~315°)。因此,可以判断该时段两台风速风向计风速监测数据差异较大与风向有关,说明存在接触网支柱挡风的情况。

图10 风向段重新划分后风速差的分布

5 结论

1)提出采有相关性分析对两台风速风向计风速异常数据进行判识,采用自适应差分阈值对单台风速风向计风速异常数据进行判识的方法。该方法不仅可以判识异常数据,结合风向还可以进一步对数据异常原因进行分析。

2)按照风速对列车运行和基础设施的影响,将风速分为6 个等级,通过历史监测数据得出各等级风速下的差分阈值,将实时风速差分值与各风速段对应的阈值进行比较,从而实现对异常数据的判识。

3)对京张高速铁路风监测数据的分析表明,该方法可有效判识风速异常数据,计算量小,快速便捷。

猜你喜欢
风向监测数据差分
一类分数阶q-差分方程正解的存在性与不存在性(英文)
序列型分数阶差分方程解的存在唯一性
一个求非线性差分方程所有多项式解的算法(英)
风向
逆风歌
基于差分隐私的数据匿名化隐私保护方法
浅谈环境监测垂直管理的优势
确定风向
环保验收监测异常数据的分析与处理探讨
北京经济社会发展月度监测数据(2008年11月)