基于小波相关分析框架的大气腐蚀数据挖掘

2021-08-16 11:39那中丽付冬梅孟金桃裴梓博
装备环境工程 2021年7期
关键词:环境因素小波降雨

那中丽,付冬梅,2,孟金桃,裴梓博

(1.北京科技大学 a.自动化学院 b.新材料技术研究院,北京 100083;2.北京市工业波谱成像工程中心,北京 100083)

在线监测技术的发展使得获取大气环境下金属材料的腐蚀数据成为可能[1],采用适当的数据挖掘方法对这类数据进行挖掘,能够深入研究腐蚀和大气环境之间的复杂关系,对于理解大气腐蚀机理有重要意义[2]。

大多数学者已经利用现代数据分析方法对腐蚀和大气环境的关系进行了研究。Cao[3]利用灰色关联分析法确定了影响Q235钢大气腐蚀的重要环境因素。Li[4]利用最大信息相关系数说明了相对湿度和温度对腐蚀起着主导作用,SO2、NO2、PM2.5和PM10等大气污染物也对腐蚀产生影响。Zhi[5]建立随机森林模型分析了大气环境因素对低合金钢腐蚀的影响。Shi[6]分析了大气环境因素与腐蚀速率的Pearson相关系数的结果后,提出了用腐蚀指数来描述环境因素对腐蚀的综合影响。然而,上述的分析方法都属于时域分析方法,要求被分析的数据是平稳的,但是环境数据复杂多变,并不能长时间保持其平稳性[7-8]。另外,时域分析方法虽然直观,但是无法表征出能反映数据本质特征的频率域的相互关系。小波变换是一种非平稳数据分析方法,将时域中看似复杂的数据分解为多种周期分量的叠加,进而识别出时域分析方法不能识别的数据的波动周期及其随时间的变化[9]。在小波变换基础上,提出的小波相干能够量化两个非平稳数据在时间和频率上的瞬时关联程度[10]。

文中将时频域的小波变换方法引入大气腐蚀研究领域,提出了一种适用于腐蚀数据的相关分析框架。以青岛腐蚀数据为例,分析了碳钢初期腐蚀过程中腐蚀与环境因素的相关关系。

1 数据与方法

1.1 数据收集与预处理

文中的数据来源于腐蚀站点提供的45号钢(碳钢)在青岛2018年8月2日至2018年9月5日的腐蚀数据和环境数据[11]。腐蚀数据即Fe-Cu型ACM传感器监测的电偶电流数据。环境数据包括温度、相对湿度、降雨、SO2、NO2、PM2.5、PM10和AQI。其中AQI是SO2、NO2、PM2.5、PM10、CO和O3等6项污染物的综合指标。电偶电流、温度和相对湿度的采样周期为1 min,其余环境数据的采样周期为1 h,为了统一数据的采样周期,将分钟级数据转换为小时级数据,共获得812个数据样本。由于电偶电流数据跨度过大不利于观察,将电偶电流进行对数化处理[12]。电偶电流及环境因素的波形如图1所示,可以看出,电偶电流波形无明显特征,且高度不规则变化,难以直接观察出电偶电流的变化规律。此外,电偶电流的变化与温度、相对湿度具有较高的相关性,而其余环境因素对电偶电流的影响不易观察出。因此提出一种合适的评估具有复杂变化特征的腐蚀数据的方法对于理解大气腐蚀规律有重要意义。

图1 电偶电流及环境因素的时域波形Fig.1 Time-domain waveform of galvanic current and environmental factors

1.2 基于小波的相关分析框架

由于小波变换的理论基础过于分散,不利于实际应用,笔者总结了最相关的理论,并提出了适用于腐蚀研究的相关分析框架,如图2所示。

图2 基于小波的相关分析框架流程Fig.2 The flowchart of the wavelet-based correlation analysis framework

1)小波功率谱。计算电偶电流A的小波功率,并可视化在时间-周期的二维图中,称之为小波功率谱。

对于数据长度M=812,且采样间隔Δt=1 h的电偶电流A={A(tm),m=0,…,M-1}和8个环境因素B=[温度,相对湿度,降雨,AQI,SO2,NO2,PM2.5,PM10],Bi={Bi(tm),m=0,…,M-1},利用式(1)分别对电偶电流A和8个环境因素B进行连续小波变换[9]。

式中:*表示复共轭;ψ(t)选用Morlet小波,n为平移参数,n=mΔt,m=0,…,M-1;s为尺度参数,通过公式T=2πs/6可以将尺度s转换为周期T(频率的倒数)。

连续小波变换受边缘效应影响的区域(the Coneof Influence, COI)在小波功率谱中用灰色圆锥线及较浅的阴影表示,此区域内信息可能失真,因此不进行分析[13]。

利用式(2)计算电偶电流A的小波功率,揭示其周期波动特征,并在小波功率谱中用颜色表示。

式中:XA(n,s)表示电偶电流A的连续小波变换。

2)小波相干谱。分别计算电偶电流A和某个环境因素Bi(i=1,…,8)的小波相干(Wavelet Coherence,WC)、相位差,挖掘其相关性、超前滞后和正反相关系,并可视化在时间-周期的二维图中,称之为小波相干谱。

式(3)的绝对值称之为WC,表征电偶电流A和环境因素Bi在特定时间和特定频率的相关性,在小波相干谱中用颜色表示。取值为0~1,越接近1,表示相关性越高[10]。

式中:S表示时频域中的平滑运算符[14]。分别为电偶电流A和环境因素Bi的小波功率。

通过蒙特卡洛模拟对WC进行显著性检验,重复1000次试验后,获得的5%显著性水平(p<0.05)说明WC在95%置信水平下是可靠的,在小波相干谱中用粗黑色轮廓表示[15]。

利用式(4)计算电偶电流A和环境因素Bi的相位差:

式中:Im表示虚部;Re表示实部。相位差对应于四个象限,表示电偶电流和环境因素的超前滞后和正反相关系,在小波相干谱中用箭头表示。向左和向右的箭头分别代表反相和同相关系,同(反)相关系表明环境因素的增加有利于电偶电流的增强(减小)。箭头为水平方向,表示无超前滞后关系;指向第一和第三象限,表示电偶电流变化超前于环境因素;指向第二和第四象限,表示电偶电流变化滞后于环境因素[16]。

3)定量分析。计算平均小波相干(Average Wavelet Coherence,AWC)和显著相干面积百分比(Percent Area of Significant Coherence,PASC)筛选出与电偶电流A显著相关的环境因素Bi,AWC大于0.6且PASC较大,则A和Bi显著相关,否则不相关[17-19]。

AWC表示将WC随时间和尺度进行平均[19],取值范围为0~1,AWC的值越接近1,表示相关性越强。PASC表示通过显著性检验的区域(p<0.05)占整个小波相干谱的面积百分比[20],取值范围为0~100%,PASC越大,表明相关性通过显著性检验的程度越高。

2 结果及分析

2.1 电偶电流的小波功率谱

将电偶电流进行连续小波变换,并绘制了小波功率谱(见图3),直观地显示出了电偶电流的主要波动周期以及这些周期随时间的变化。功率越高,表示周期越强,白色条纹表示功率的局部最大值。在周期为1 d的几乎所有时间段上,有一条白色条纹且附近区域内颜色大部分为黑色,意味着此周期存在一个很强的永久循环,说明电偶电流存在以1 d为主的周期变化特征。同时在周期为2 d的250~500 h、周期为5 d的200~450 h以及周期为11 d的325~625 h也发现有白色条纹。由图1可看出,这些时间段内有降雨发生,初步推断是降雨导致了电偶电流的间歇性波动,将在2.2节中进行讨论。

图3 电偶电流的小波功率谱Fig.3 The wavelet power spectrum of galvanic current (On the right of the picture is a color bar ranging from white (lower power) to black (higher power), the thick black contour indicates 5% significance level, and the gray cone line and lighter shade indicate COI)

2.2 电偶电流和环境因素的小波相干谱

为了解驱动电偶电流变化的潜在原因,绘制电偶电流和环境因素的小波相干谱,如图4所示。

图4a显示,在0.5~3 d的周期区间,电偶电流和相对湿度在所有的时间呈现出强相关性,WC达到0.95;4~7 d周期区间上的200~400 h以及6~15 d周期区间上的300 h之后,WC达到0.9。显著相关区域中的箭头水平向右,相位差为0,表明电偶电流和相对湿度呈现正相关关系且无超前滞后关系。

图4b显示,电偶电流和温度在0.5~1.5 d的周期区间内具有强相关性,WC达到0.95。除此之外只有几个间歇性的强相关区域,如1.5~3 d周期区间上的250~350 h和600~650 h以及4~7 d周期区间上的200~400 h,WC达到0.9。显著相关区域中的箭头水平向左,相位差为π,表明电偶电流和温度呈现负相关关系,且无超前滞后关系。

图4c中显著相关区域中的箭头大部分指向斜右下方,范围为0~–π/2,表明电偶电流和降雨呈现正相关关系,且降雨超前于电偶电流。观察小波相干谱发现,200 h前后发生了结构性变化,在此之前基本没有强相关区域。在200~450 h内,1.5~3 d和4~7 d的周期区间都具有很高的相关性,WC达到0.9。在450~700 h内的4~6 d的周期区间以及700~770 h内的1.5~3 d的周期区间也具有强相关性,WC达到0.9。降雨的发生时间可以解释这种结构性变化,由降雨数据可知,降雨分布在250~425 h以及600~660 h以及750~770 h内。

图4 电偶电流和环境因素的小波相干谱Fig.4 Wavelet coherence spectrum of galvanic current and environmental factors: a) RH, b) T, c) RF, d) AQI, e) SO2, f) NO2, g)PM2.5, h) PM10

AQI和污染物(NO2、SO2、PM2.5和PM10)与电偶电流的显著相关区域较小,不易得到直接的规律。观察各环境因素与电偶电流显著相关性较强的区域,周期为1 d左右的周期区间内,温度和相对湿度与电偶电流显著相关,说明温度和相对湿度导致了电偶电流的日波动特征,同时温度和相对湿度可能存在相互作用。周期为2、5 d左右,电偶电流具有间歇性波动的时间内,降雨与电偶电流显著相关,说明降雨导致了电偶电流的间歇性波动特征。同时在这些周期区间,电偶电流与温度和相对湿度也存在显著相关区域,说明温度、相对湿度和降雨也可能存在相互作用。环境因素间的相关特征及其对电偶电流的作用有待进一步深入研究。

2.3 电偶电流和环境因素的定量分析

由于直接观察小波相干谱难以对电偶电流与环境因素的相关程度进行排序,计算AWC以及PASC得到大气腐蚀过程中不同环境因素的相对重要性,结果见表1。一般认为,AWC大于0.6为强相关。由表1发现,电偶电流与温度、相对湿度、降雨、NO2和PM2.5强相关,但NO2和PM2.5的PASC分别为6.61%和3.36%,可能是由于偶然因素造成的强相关性。因此与电偶电流相关程度较高的环境因素排序为相对湿度>温度>降雨,其中相对湿度对电偶电流的影响远远大于其他环境因素,AWC为0.8730,且PASC为39.53%。污染物在青岛初期腐蚀过程中与电偶电流的相关程度不高,可能原因是采样时间段内污染物浓度较低,PM10、PM2.5、SO2、NO2和AQI的平均值分别为40.4、16.3、9.6、12.9 µg/m3和40.8。AQI虽然是SO2、NO2、PM10、PM2.5、CO和O3等6项污染物的综合指数,但不能很好地代替这些污染物对电偶电流的综合影响,如NO2的AWC和PASC都大于AQI的AWC和PASC。

表1 电偶电流和环境因素的AWC和PASCTab.1 AWC and PASC of galvanic current and environmental factors

3 结论

1)基于小波的相关分析框架,为理解腐蚀过程以及探究环境因素对腐蚀的影响提供了一种新的解决途径。首先它能够清晰地显示出复杂腐蚀过程的变化特征;其次相比于传统的时域分析方法,更全面地揭示了腐蚀和环境因素的相关关系,不仅量化了数据间的整体相关强度,还可以提供相关性发生的时间和频率、超前滞后以及正反相关系。

2)通过电偶电流的小波功率谱,清晰地显示出腐蚀的周期波动特征及其随时间的变化。结果表明,在采样期间,腐蚀有显著的日波动特征,同时在降雨时刻具有间歇性波动。

3)基于小波的相关分析框架,挖掘了电偶电流和环境因素的关系,结果表明,与腐蚀相关程度较高的环境因素排序为相对湿度>温度>降雨,其中相对湿度和降雨与腐蚀呈现正相关,且降雨超前于腐蚀,温度与腐蚀呈现负相关。SO2、NO2、PM2.5和PM10浓度较低导致其与腐蚀的相关程度较弱。

猜你喜欢
环境因素小波降雨
我可以重置吗
基于Haar小波变换重构开关序列的MMC子模块电容值在线监测方法
空间环境因素对西北地区电离层空间特征影响
构造Daubechies小波的一些注记
降雨型滑坡经验性降雨型阈值研究(以乐清市为例)
泥石流
城市物流配送系统的环境因素影响评估
造成数学学困生的原因
浅谈会计目标定位
青蛙历险