ARIMA模型在黄石市PM 2.5浓度预测中的应用

2017-06-22 13:45徐治欠
关键词:黄石市时间段差分

黄 芸,姜 国,徐治欠

(湖北师范大学数学与统计学院,湖北 黄石 435002)

ARIMA模型在黄石市PM 2.5浓度预测中的应用

黄 芸,姜 国,徐治欠

(湖北师范大学数学与统计学院,湖北 黄石 435002)

PM2.5的精确预测对空气质量评估和大气污染防治工作起着关键性作用 .由于PM2.5浓度受多种因素影响,不同时间段内变化模式存在较大差异,将序列分时段可以提高预测精确度。根据2015年黄石市市区PM2.5日均浓度变化特征,建立了分时段ARIMA模型,进而对黄石市PM2.5浓度进行深入分析及可靠预测。

PM2.5;ARIMA模型;时间序列

0 引言

目前,PM 2.5污染已经成为社会的热议话题。PM 2.5是指大气中的细颗粒物通过对太阳光的吸收,反射或散射降低大气能见度,使太阳辐射强度降低,是雾霾制造者之一。这种微小颗粒被吸入肺部后,对身体健康危害极大。PM 2.5的准确预测有利于人们采取必要的防护措施。因此建立有效的PM 2.5浓度预测模型具有重要的现实意义。许多专家对PM 2.5污染进行了相关研究,并且提出了其存在的问题以及改进的方法。孙柏峰[1]根据吉林省某市 2001~2010[3~5]年的空气质量监测情况,结合数学模型对该市的空气质量进行了评价与预测 ;邵银念[2]等运用模糊数学方法,通过计算污染因子权重值和隶属度对乌鲁木齐市 2007年度大气环境质量就进行了综合评价;国外对大气污染的统计预测做了广泛研究,主要运用多元统计分析理论、灰色预测模型、神经网络预测模型等。其中,用法最广的是神经网络预测模型[7],它在非线性模型上有较好的拟合效果,但存在难已确定网络结构等问题,影响预测模型的泛化能力。

本文根据相关部门提供的实时数据,运用时间序列方法,建立了 ARIMA模型[6]。对黄石市市区 2015年 PM 2.5日均浓度进行短期预测,探讨了黄石市空气质量发展趋势。

1 ARIMA模型的结构及建模

1.1 ARIMA模型的结构

建立 ARIMA模型,是研究时间序列的重要方法,它是由自回归模型 ( AR模型 )和滑动平均模型 ( MA模型 )构成,简记为 ARIMA (p,d,q)模型:

1.2 ARIMA模型的建模过程

非平稳时间序列可以利用差分转化为平稳时间序列来进行ARMA(p,q)的拟合。根据时序图和自相关图判断序列是否具有平稳性。若数据是非平稳的,则可以通过差分对数据进行处理后再重复以上步骤使序列平稳。在对序列进行白噪声检验时,若为非白噪声序列,则要对平稳的非白噪声序列进行ARMA(p,q)拟合。

数据平稳性处理后,应用SAS的PROC ARIMA功能分析序列的自相关系数(ACF)和偏自相关系数(PACF)变化趋势,估计自相关阶数(p)和滑动阶数(q)的值。用最小二乘估计检验每个参数是否显著不为零,如果有不显著的参数要剔除其对应的自变量进行新的拟合。

检验拟合后的模型是否提取了足够充分的信息,也就是残差的白噪声检验。是白噪声,则拟合有效;反之,需重新拟合模型。模型的有效性检验是LB统计量对残差进行2检验 。在SAS程序中的调用 FORECAST程序,可以对未来的情况进行预测和进行趋势分析。

2 实例分析

收集到黄石市2015年城区 PM 2.5日均浓度的相关数据 (来自黄石市有关部门实时数据 ),选取时间段为 2015年 1月 1日~12月 31日,除因停电以及设备故障等偶然性因素所缺失的 1个数据外,共有 364个有效数据。

2.1 绘制序列时序图

根据空气质量数据绘制时序图如下:

图1 全年PM 2.5日均浓度时序图

由图1可以看出全年PM 2.5日均浓度序列为非平稳序列,不同时间段污染物均值呈现的差异较大,因此选择分时间段模型进行预测。对不同时间段时间序列进行平稳化处理,以 1~3月份为例,对这段时间的PM 2.5日均浓度序列作一阶差分后绘制时序图(图2)。分时间段后的 PM 2.5日均浓度序列波动平稳,初步判断变化后的序列为平稳序列 。

图2 1~3月份PM 2.5日均浓度差分时序图

2.2 模型定阶

观察差分后序列的自相关图和偏自相关图的性质,进一步确定平稳性判断以及拟合模型阶数。

图1 程序运行1差分后1~3月份PM 2.5日均浓度序列自相关图

图2 程序运行2差分后1~3月份PM 2.5日均浓度序列偏自相关图

自相关图(程序运行 1)显示, 2阶之后自相关系数都在零值附近波动。可以认为自相关系数具有短期相关性,差分后的序列类似平稳。2阶自相关系数显著大于 2倍标准差范围。观察偏自相关图(程序运行 2)得到的结论和上述基本一致。

2.3 参数估计

图3 程序运行 3参数估计

运用最小二乘法,确定拟合模型(程序 3)。1~3月份选用ARIMA(2,1,1)模型,其估计结果为: (1-0.65085B+0.31979B2)△PM2.5= (1-0.74408B)εt.

同理可得其他不同时段序列的估计结果: 4~6月份选用ARIMA(1,1,2)模型,估计结果为:(1-0.57605B)△PM2.5= 0.000118+ (1-0.67346B-0.32654B2)εt;7~9月选用ARIMA(1,1,1)模型,估计结果为:(1-0.61804B)△PM2.5= (1-0.96232B)εt;10~12月份选用ARIMA(1,1,1)模型,估计值为:(1-0.53976B)△PM2.5 = (1- 0.90985B)εt. 式中:B为延迟算子;εt(t=0,1,2,…) 为白噪声序列 。

2.4 假设检验

图4 程序运行4模型的参数检验

以1~3月为例,由残差白噪声检验结果得到检验统计量的P值都显著大于 0.05(程序运行 4),则可认为残差序列为白噪声序列,系数显著性检验显示两系数均显著。这就证明 ARIMA(2,1,1)模型对该序列建模成功。

2.5 模型预测

表1 两种模型各季度最后一天的PM 2.5日均浓度预测表

由表1可以看出:分时短PM 2.5日均浓度序列模型预测的相对误差小于全年PM 2.5日均浓度序列模型的相对误差,且相对误差不超过12%,预测效果较好;分时段PM 2.5日均浓度序列模型 3~6月以及 6~9月PM 2.5浓度值较低,属于污染相对较轻的轻度污染;而 1~3月及10~12月浓度值较大,属于污染较重的中度污染与重度污染。

3 结论以及建议

本文利用黄石市实时数据,对黄石市2015年大气PM 2.5日均浓度数据进行相关分析,根据不同时间段污染浓度的分布特征,建立了分时间段ARIMA (p,d,q)预测模型;并预测了不同季度最后一天的污染浓度值,通过将其与全年时间序列模型的结构进行比较验证。结果显示分时间短预测结果与实值相对误差更小,分时间段预测的结果相对更好。

ARIMA模型是一种较好拟合PM 2.5日均浓度序列的方法,该模型便于数据处理,变化灵活,方便推广到其他城市的大气污染数据观测中。但由于PM 2.5浓度受排放源和气象条件影响及模型自身的限制因素,只能进行短期预测。在未来,可以结合空间预测模型与非线性动力学为大气污染预测提供评价、预警和治理方法。

[1]孙柏峰 .吉林省某市空气质量评价及预测[D].长春:吉林大学 ,2013.

[2]廖银念 ,苏玉红 ,艾尼瓦尔 买买提 .城市空气质量的模糊综合评价——以乌鲁木齐市为例 [J].北方环境,2011,11:143~144.

[3]Reilly P. Time series modeling of global mean temperature for managerial decision-making[J]. Journal of Environment Management, 2005, 76(1):61~70.

[4]Huber P J.Robust Statitics[M]. New York: Wiley, 1981.

[5]Han Jiawei, Kamber M. Data mining: concepts and techniques[M].Morgan Kaufmann Publishers,2000: 7~9.

[6]王 燕 .应用时间序列分析 (第三版 )[M].北京:中国人民大学出版社, 2005.

[7]Grivas G A. Chaloulakou. Artificial neural network models for prediction of PM 2.5 hourly concentrations, in the Greater Area of Athens[J]. Atmospheric Environment, 2006.40(7): 1216~1229.

ARIMA model of Huangshi’s PM 2.5 and its application

HUANG Yun,JIANG Guo,XU Zhi-qian

(College of Mathematics and Statistics,Hubei Normal University,Huangshi 435002,China)

The accurate prediction of PM 2.5 plays a key role in atmospheric pollutant and management. Since there are exist many factors that effect PM 2.5 and the models are various in different time interval, the segmented time series can improve the prediction of PM 2.5.According to the characteristics of time series of concentration variation of PM 2.5 , this article build a new segmented ARIMAmodel. Moreover, we give a deeply analysis and reliably forecast of PM 2.5 in Huangshi.

PM 2.5; ARIMA model; time series

2016—10—11

湖北省科技厅自然科学基金项目( 2016CFB526),湖北省大学生创新创业项目( 201410513022)

黄芸(1990— ),女,湖北黄石人,硕士研究生,主要研究方向为随机过程及其交叉领域.

O163

A

2096-3149(2017)02- 0038-05

10.3969/j.issn.2096-3149.2017.02.009

猜你喜欢
黄石市时间段差分
RLW-KdV方程的紧致有限差分格式
数列与差分
夏天晒太阳防病要注意时间段
The Simple Analysis of the Usages of “IT”
发朋友圈没人看是一种怎样的体验
黄石市文化发展的路径选择
黄石市助残机构发展情况的调查
不同时间段颅骨修补对脑血流动力学变化的影响
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR