污染源在线监测数据超标预测方法浅述*

2020-04-16 06:30马琳张芳董智鹤王伟
中国科技纵横 2020年19期
关键词:污染源预警预测

马琳 张芳 董智鹤 王伟

(中国石油集团安全环保技术研究院有限公司,北京 102200)

0.引言

开展数据预警预测工作的目的,是为了通过对历史数据中隐含的规律、相关性等信息进行挖掘分析,从而能够对未来出现的情况进行趋势或阈值预估,以提前作出判断,减少可能造成的损失或增加收益[1]。就目前的污染源在线监控系统而言,对超标排放的管理仍停留在超标数据发生后由系统依据已设定的排放限值进行识别和报警,以提示工作人员进行原因排查,而缺乏通过趋势分析进行超标预警预测的研究应用。开展污染源在线监测超标预警预测的研究,对提升环境管理水平具有十分重要的应用意义。

本文立足石油企业污染源监测领域,结合笔者多年的实际工作经验,对污染源在线监测数据超标预警数据模型进行阐述,并对几种预测模型的优劣进行对比分析,最后,笔者就模型的优劣方面,对今后环境管理数据监测超标预警起到一定的推动作用。

1.超标预警的应用现状

超标预警技术已广泛应用于各个领域。宁勇采用基于相似关系的SWFCM 聚类算法,对海洋环境数据开展分析,并应用到赤潮预测预警中,提高了赤潮灾害预警预测能力,为海洋经济可持续发展助力。李晶晶研究了空间关联规则挖掘方法,用以在海量的环境监测数据中挖掘空气污染指数和时空时间的关联规则。吴贵华用朴素贝叶斯分类法对多种水质监测指标进行筛选,从中找出对CODMn 的最关键影响因素;之后运用BP 神经网络技术预测CODMn 第二天的数据。夏继伟等通过分析对比几种大气污染预警方法,选用神经网络研究港口大气污染预警模型,实现了通过预警合理安排进港船舶,预防大气污染,并在某港口得以实际应用,证实其方法的可行性[2]。时间序列法在地表水质预测中已有应用先例,它是将统计数据资料按照时间顺序排列,在序列中提取主要的内在因素周期性叠加、外延,通过数学回归的方法对未来状态进行预测。在其他行业的在线监测数据挖掘分析方面,李子龙运用灰色关联度算法找寻参数之间的关系,进而运用聚类算法,得到设备运行状态规律,并在某机组应用了该数据分析方法,比人工点位检查和生产中央控制系统更快发现生产设备隐患,实现了提前预警[3]。周茜将分类算法应用在变电站电气设备在线监测数据的处理和预测中,取得良好效果,改变了数据分析不及时、不到位的现状,使电气设备的在线监测达到了真正目的。

预警技术在其他行业数据分析中的应用,为污染源在线监测超标预警预测研究提供了参考方向。

2.时间序列研究方法浅述

在无法获得企业前端生产调整关键参数数据时,综合考虑预测方法在各领域的应用经验以及方法适用性,可优选时间序列方法作为超标数据的研究方法。时间序列是一种已被广泛应用的数据挖掘分析算法[4]。它通常需要挖掘不同时间段内得到的数据样本,并通过这些数据的变化、趋势、走向进行分析,得到演算结论。影响时间序列变化的因素主要有趋势性、周期性、季节性以及不规则变化,其中部分因素造成的影响是长期性、决定性的,因此时间序列的变化在某种程度上呈现出一种趋势性,且具有一定的规律。在应用时,首先需要假设某一类数据存在一种既定的变化模式,或者存在某种组合模式,而这种趋势或模式是会重现的,才使用时间序列进行预测[5]。因而,研究时需要先对这种模式进行识别,然后外推预测,其关键因素是识别变化模式,同时要求决策者所采取的行动对这个时间序列影响较小。

例如对某事物的演变过程进行观测和记载,数据记为Yt,经过时间点t1,t2…,tn(t 为自变量,且t1<t2<tn,即随时间推移递增)观察,测量得到一个集合,记为Yt1,Yt2…,…,Ytn,则称Yt为数字离散时间序列。时间序列的研究方法主要有单变量和多变量时间序列预测。

2.1 单变量时间序列预测

分为随机时间序列和传统时间序列两种预测方式,根据数据类型的不同,将采用不同的算法和模型进行预测。如果建立的模型设计循环变动(R)、季节变动(S)和长期趋势(L)三个部分,可以用式(1)如下模型进行数据(D)预测:

其中:循环变动(R)表示预测值在时间周期内存在循环变动的规律;季节变动(S)表示预测值与时间季节之间存在潜在变化规律;长期趋势(L)表示随时间推移将呈现某种特定的变化规律,上升、下降或在某一个阈值间以某一种规律波动,或逼近于某个阈值等;error 为误差。

2.2 多变量时间序列预测

搭建随机的时间序列模型,预测未来的发展,主要有ARMA(自回归移动平均模型)、AR(自回归模型)[6]和MA (移动平均模型)。

本模型没有自回归部分,故称为阶移动模型,记为MA(m)。

通过对ARMA 模型进行差分运算,还可以得到另外一种ARIMA 模型,即Autoregressive Integrated Moving Average Model,其全称是自回归积分移动平均模型,进行超标数据预测。它按照原序列平稳与否、回归所含内容不同,ARIMA 模型包括MA—移动平均过程、AR—自回归过程、ARMA—自回归移动平均过程及ARIMA 过程,是ARMA 模型的拓展,包含ARMA 模型的3 种形式。该模型用于随机游走序列,能够预测数据波动,它可以用表达式ARIMA(p,d,q)表示,其中MA 为移动平均,q 为移动平均项数,d 为时间序列平稳时的差分次数;AR 为自回归,p 为自回归项。即式(5):

则wt是平稳序列,于是可对wt建立ARMA(p,q)模型,所得到的模型称为Xt~ARMA(p,d,q)模型,故ARIMA(p,d,q)模型表示为式(7):

3.结语

笔者通过建立相关模型,并利用模型预测排放浓度,结合影响生产装置外排烟气中污染物浓度的主要因素,可建立污染物排放超标预警方法,可为生产企业的环保管理和应对预案控制提供依据,供广大同仁在今后环境管理数据超标监测方面参考借鉴。

猜你喜欢
污染源预警预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
持续推进固定污染源排污许可管理全覆盖
法国发布高温预警 严阵以待备战“史上最热周”
基于污染源解析的空气污染治理对策研究
十二五”期间佳木斯市污染源排放状况分析
园林有害生物预警与可持续控制
机载预警雷达对IFF 的干扰分析
预警个啥