Holt-Winters与ARIMA模型在电离层总电子含量预报中的比较

2019-02-12 10:37唐诗华陈雨田田祥雨
桂林理工大学学报 2019年4期
关键词:太阳活动纬度电离层

唐 宏,唐诗华,陈雨田,田祥雨

(1.桂林理工大学 a.测绘地理信息学院;b.广西空间信息与测绘重点实验室,广西 桂林 541006;2.深圳市中地软件工程有限公司,广东 深圳 518057)

电离层总电子含量(TEC)值直接影响电离层延迟的大小, 精确测定与预报TEC值对于建立精确的电离层延迟改正模型具有十分重要的意义[1]。 目前常用的对TEC值进行预报的方式有两种: 一种是利用来自经验或半经验模式的TEC数据建立起反映TEC值变化规律的经验公式, 从而建立预报模型, 如Klobuchar模型[2-5]、 IRI模型[6-7]等; 另一种是利用高精度电离层TEC资料采用数理统计方法来建立预报模型, 如神经网络模型[8-9]、时间序列模型[10]等。其中时间序列模型由于其样本要求少、计算过程简单、外延性好等优点,逐渐受到国内外学者的关注,并取得了一些成果。尽管现有的一些研究中利用时间序列模型对TEC值进行预报取得了不错的效果,但是这些研究并未充分考虑外在因素对预报精度的影响,如太阳活动、纬度、预报时长等。因此,研究这些因素对模型预报精度的影响规律,对于更好地建立和完善TEC预报体系具有十分重要的意义。自回归积分滑动平均模型(ARIMA)[11-15]计算简单操作方便, 并且具有较高的预报精度, 是时序方法中应用较为广泛的一种模型。 Holt-Winters[16-17]可以同时处理趋势性和季节性变化, 并能够过滤掉随机波动的影响, 适用于包含趋势季节变化的时间序列预测问题。

本文采用ARIMA模型、 Holt-Winters加法模型、 Holt-Winters乘法模型3种时间序列模型, 利用IGS中心发布的不同太阳活动情况下、 不同纬度位置的TEC样本数据预报不同时长的TEC值, 并将预报值与IGS中心提供的数据进行对比, 在分析上述3种时间序列模型预报精度的同时, 还研究了太阳活动、纬度位置、预报时长这3种因素对模型预报精度的影响。

1 ARIMA(p,d,q)模型原理

ARIMA模型的数学表达式为

(1)

ARIMA模型本质上是回归移动平均模型(ARMA)的扩展,通过将非平稳时间序列yt进行d阶逐期差分使yt变得平稳, 从而能够利用ARMA(p,q)模型对该序列建模,然后再经过逆变换得到原序列。上述过程便是ARIMA模型的建模方法。具体的建模步骤为: ① 序列的平稳化处理: 如果原序列是非平稳的, 则需要对其进行差分变换得到平稳序列yt; ② 模型识别: 利用自相关系数和偏相关系数来确定模型的阶数p和q; ③ 参数估计与检验: 估计模型的未知参数φi和θj, 并且检验其显著性和合理性; ④ 分析预测:利用模型进行预测和分析。

2 Holt-Winters模型原理

Holt-Winters模型将具有趋势性、 季节性变化和随机波动的时间序列进行分解, 结合指数平滑方法来建立预报模型, 以对趋势性和季节性变化作出预测, 包括无季节模型、 加法模型、 乘法模型3种, 其中后两种适用于具有季节性变化的时间序列预报问题。考虑到电离层的季节性变化,本文采用加法模型和乘法模型来进行TEC值的预报。

Holt-Winters加法模型基本公式

(2)

加法模型的初值计算公式为

(3)

Holt-Winters乘法模型基本公式

(4)

乘法模型的初值计算公式为

(5)

式中:Xt、St、It和bt分别为t时刻的观测值、 稳定成分、 季节成分和趋势成分,t=1,2,3,…,L;m为预测期数;Ft+m为第m期预测值;L为季节长度;α、β、γ为平滑参数。

3 太阳活动周期变化

研究表明,太阳活动呈现出以11年为周期变化[18],由图1(https://omniweb.gsfc.nasa.gov/)中太阳黑子相对数的27天均值变化可以看出2011年正处于太阳活动的上升期,其太阳黑子相对数急剧增加,而2009年的太阳黑子相对数小于10,该年处于太阳活动的平静期。

太阳的周期性活动会对不同纬度地区的电离层TEC值造成不同的影响,使得预报的效果降低,考虑到这一因素,将上述模型进行对比实验,分析各个模型受太阳活动的影响,并比较其在不同年份、不同纬度地区的预报精度。

4 实验分析

4.1 数据准备

太阳活动具有11年左右的周期,第24太阳活动周开始于2008年末,从2010年开始太阳活动明显增强[19-20]。也就是说,2009年处于太阳活动的平静期,2011年处于太阳活动的活跃期[18]。因此,选取IGS中心发布的2009年年积日151—165高纬度(75°N, 110°E)、 中纬度(35°N, 110°E)、 低纬度(7.5°N, 110°E)数据作为电离层平静期样本序列; 选取2011年年积日101—115高纬度(75°N, 110°E)、 中纬度(35°N, 110°E)、 低纬度(7.5°N, 110°E)数据作为电离层活跃期样本序列。利用前15天的数据作为样本序列, 分别采用ARIMA模型、 Holt-Winters加法模型、 Holt-Winters乘法模型预报后5天的TEC值, 并将预报结果与IGS发布的TEC观测值进行对比。 通过定义相对精度P、 日均相对精度P′和均方差RMS来衡量预报精度

图1 2000—2017年太阳黑子相对数27天均值变化Fig.1 27 days mean relative sunspot numbers from 2000 to 2017

(6)

(7)

(8)

式中:Ipre为预报值;IIGS为IGS中心发布的观测值;N为当天观测的历元数。

4.2 结果比较与分析

利用3种模型对不同纬度地区在电离层平静期、 活跃期5天的TEC值进行预报, 得到图2~4所示的预报结果与实际观测数据对比图。 其中,横坐标表示历元(每2 h一个历元), 纵坐标表示TEC值。 无论是在平静期还是在活跃期, 3种模型对高、 中、 低纬度地区TEC值的预报都能够很好地反映其变化特征。 但对比发现, 总体上看加法模型预测得到的TEC值与实际值符合情况最好, 乘法模型与ARIMA模型的符合情况稍差。 从太阳活动角度分析, 3种模型在太阳活动平静期的预报效果均要明显好于活跃期; 从纬度位置角度分析, 3种模型的预报效果在不同纬度地区会有所差异; 从预报时长角度分析, 3种模型的预报精度均会随着预报时长的增加而下降。

图2 高纬度地区电离层2009年平静期(a)、 2011年活跃期(b)TEC值预报结果Fig.2 TEC forecast results at high latitude in ionospheric quiet(a) and active(b) periods in 2009 and 2011

表1和表2分别为电离层平静期和活跃期3种模型预报值残差统计。

在平静期, 加法模型、 乘法模型和ARIMA模型预报值的残差分别有78%、 57%和56%是在1 TECu之内, 有96%、 76%和82%在2 TECu之内, 说明在平静期加法模型的预报效果最好, ARIMA模型预报效果次之, 乘法模型预报效果则相对要差些; 而在活跃期, 3个模型预报值残差在1 TECu之内的分别有23%、 26%、 18%,在3 TECu之内的分别有52%、58%、53%,说明在活跃期乘法模型的预报效果相对来说更为理想,但是并未表现出明显的优势;同时可以看出3种模型在平静期的预报精度明显高于活跃期。

图3 中纬度地区电离层2009年平静期(a)、 2011年活跃期(b)TEC值预报结果Fig.3 TEC forecast results at mid-latitude in ionospheric quiet(a)and active(b)periods in 2009 and 2011

图4 低纬度地区电离层2009年平静期(a)、 2011年活跃期(b)TEC值预报结果Fig.4 TEC forecast results at low latitude in ionospheric quiet(a)and active(b)periods in 2009 and 2011

表1 3种模型电离层平静期预报值残差(Δ)统计

Table 1 TEC forecast values residual statistics of three models in ionospheric quiet period %

天数Δ<1 TECu加法模型乘法模型ARIMA1 TECu≤Δ≤2 TECu加法模型乘法模型ARIMA2 TECu≤Δ≤3 TECu加法模型乘法模型ARIMAΔ>3 TECu 加法模型乘法模型ARIMA177.7855.5672.2219.4533.3425.02.788.332.780.002.780.00280.5680.5658.3316.6716.6733.342.782.785.560.000.002.78 377.7863.8963.8919.4413.8922.222.7816.6716.670.005.565.56 480.5647.2247.2216.6713.8930.562.7816.6711.110.0022.2211.11 575.038.8941.6713.8913.8916.6711.1111.1116.670.0036.1125.00平均值78.3457.2256.6717.2218.3425.564.4511.1110.560.0013.338.89

表2 3种模型电离层活跃期预报值残差(Δ)统计

Table 2 TEC forecast values residual statistics of three models in ionospheric active period %

天数Δ<1 TECu加法模型乘法模型ARIMA1 TECu≤Δ≤2 TECu加法模型乘法模型ARIMA2 TECu≤Δ≤3 TECu加法模型乘法模型ARIMAΔ>3 TECu 加法模型乘法模型ARIMA130.5622.2236.1119.4436.1130.5613.895.5613.8936.1136.1119.44 213.8936.1111.1119.4419.4425.0025.008.3322.2241.6736.1152.78 320.3525.0011.1111.1119.4422.2216.6711.115.5641.6755.5661.11 441.6730.5611.115.5619.4411.112.785.5616.6750.0044.4561.11 58.3316.6725.0027.7811.118.335.5622.2216.6758.3350.0050.00 平均值22.6926.1118.8916.6721.1119.4412.7810.5615.0045.5644.4548.89

分析平静期3个模型的预报残差会发现, 加法模型在前4天预报表现较为平稳, 均有约96%的预报残差能保持在2 TECu之内, 而到了第5天则下降至89%; 乘法模型在前两天均有89%的预报残差保持在2 TECu之内, 到了第3天则下降至78%, 第4天进一步降至61%;ARIMA模型在前两天有92%的预报残差保持在2 TECu之内,第3、4天降至约78%,第5天进一步降至58%。以上分析说明,在平静期3种模型的预报精度会随着预报时长的增加而下降;加法模型能够维持5天以上的精确预报,而乘法模型和ARIMA模型只有3天左右。在活跃期,3种模型的预报精度随着预报时长的增加波动较大,但是从总体上看依旧呈下降趋势。

表3和表4分别是平静期和活跃期3种模型预报值相对精度统计。

表3 3种模型电离层平静期年预报值日均相对精度(P′)

Table 3 Daily relative accuracy of TEC forecast values for three models in ionospheric quiet period

天数高纬度(75°N,110°E)加法模型乘法模型ARIMA中纬度(35°N,110°E)加法模型乘法模型ARIMA低纬度(7.5°N,110°E) 加法模型乘法模型ARIMA194.6995.6694.8994.8688.3191.3488.3588.8591.97 292.7394.0395.0094.2393.1990.3392.1392.7280.31 394.4096.5995.0994.0588.7786.5190.0189.6078.57 495.7796.9990.9095.8378.3582.2890.6378.9557.41 594.8795.1391.6892.4162.9375.6788.1771.4246.95 平均值94.4995.6893.5194.2882.3185.2389.8684.3171.04

表4 3种模型电离层活跃期年预报值日均相对精度P′

Table 4 Daily relative accuracy of TEC forecast values for three models in ionospheric active period %

天数高纬度(75°N,110°E)加法模型乘法模型ARIMA中纬度(35°N,110°E)加法模型乘法模型ARIMA低纬度(7.5°N,110°E) 加法模型乘法模型ARIMA195.5894.3592.2175.2781.0292.2789.6286.8387.21 291.2094.2994.2775.6388.0485.0383.3778.8180.50 393.6295.9285.9569.3086.0685.7574.9272.3854.67 496.9395.4287.6652.6177.4182.9983.3880.6958.46 586.8177.7487.1264.9085.8280.4180.0286.8948.99 平均值92.8391.5489.4467.5483.6785.2982.2681.1265.97

在平静期,3种模型预报值的相对精度均随着纬度的降低而下降:就高纬度地区而言,3种模型预报值的相对精度大致相当,平均值均为94%左右;就中纬度地区而言,加法模型的预报精度最高,相对精度均值为94%,乘法模型和ARIMA模型的预报精度相当,相对精度均值在84%左右;就低纬度地区而言,加法模型的预报精度最高,相对精度均值将近达到90%,乘法模型次之,相对精度均值为84%,ARIMA模型较差,相对精度均值仅为71%。而在活跃期,3种模型预报值相对精度在高纬度地区大致相当,均在90%左右;在中纬度地区,加法模型的预报精度较差,相对精度均值约为68%,乘法模型和ARIAM模型的预报精度更好,相对精度均值为84%左右,这与平静期所呈现规律有所不同,原因是活跃期电子含量变化较大,对建立模型带来了一定的偏差;而在低纬度地区,加法模型和乘法模型的预报精度较好,相对精度均值为81%左右,ARIMA模型的预报精度较差,相对精度均值仅为66%;总体上看,在活跃期3种模型的预报精度也是从高纬度向低纬度呈递减趋势。另外,3种模型预报值相对精度也是随着预报时长的增加而成递减趋势。

表5为3种模型预报值均方差统计。在平静期, 3种模型5天预报值均方差的平均值比在活跃期要小, 说明在平静期的预报精度更高, 与表1和表2所得结论相同。 在平静期,3种模型5天预报值均方差的平均值随着纬度的降低而增大, 预报精度下降; 而在活跃期,总体上也呈现相同趋势, 但表现出一定的波动,这同样是因为在活跃期电子含量变化幅度较大,使得原始时间序列较不平稳,虽然经过平稳化处理,但还是给模型的建立带来了一定的误差。 分析预报时长对预报精度的影响,对3种模型每天各纬度的预报值均方差求平均值, 在平静期, 加法模型从第1天的0.88增加到第5天的1.05;乘法模型从第1天的1.21增加到第5天的2.88;ARIMA模型从第1天的0.84增加到第5天的2.19。在活跃期,加法模型从第1天的3.05增加到第5天的5.86;乘法模型从第1天的3.84增加到第5天的4.47;ARIMA模型从第1天的2.31增加到第5天的8.72。3种模型的预报精度均随着预报时长的增加呈递减趋势,与从表1和表2所得结论相同。

表5 3种模型预报值均方差RMS统计Table 5 RMS of forecast values for three models in active and quiet periods

5 结 论

本文分别采用Holt-Winters加法模型、Holt-Winters乘法模型和ARIMA模型,利用IGS中心发布的不同纬度地区不同太阳活动情况下的电离层TEC样本数据进行5天的预报,并且将预报结果与IGS中心提供的实测数据进行对比分析,得到如下结论:

(1)3种模型的预报精度会随着纬度的降低和预报时长的增加而下降;相较于太阳活动活跃期,3种模型在太阳活动平静期的预报精度更高。

(2)太阳活动平静期:在高纬度地区,3种模型的预报精度相当;在中纬度和低纬度地区,Holt-Winters加法模型的预报精度要优于另外两种模型。

(3)太阳活动活跃期:在高纬度地区,3种模型的预报精度相当;在中纬度地区,Holt-Winters乘法模型和ARIMA模型预报精度相当,优于Holt-Winters加法模型;在低纬度地区,Holt-Winters加法模型和Holt-Winters乘法模型的预报精度相当,要优于ARIAM模型。

(4)Holt-Winters加法模型能够维持5天以上较为精准的预报,而乘法模型和ARIMA模型只有3天左右。

猜你喜欢
太阳活动纬度电离层
一种电离层TEC格点预测模型
第24太阳活动周中国地区电离层闪烁统计特性研究
第23和24太阳活动周高纬地磁感应电流分布特性
Kalman滤波估算电离层延迟的一种优化方法
纬度未知条件下的抗扰动惯性系初始对准改进方法
纬度
电离层对中高轨SAR影响机理研究
Linux Shell语言在电离层解算中的应用
太阳活动与地球气候变化之间的关系