基于主成分分析对历史文化保护区的空气质量评价

2018-01-24 14:19李冰月周新宇王楠梁冰
绿色科技 2018年4期
关键词:主成分分析空气质量

李冰月 周新宇 王楠 梁冰

摘要:为了实现对白塔寺历史文化区的精细化管理,在该区域内部署了60套CityGrid -体化传感器进行实时监测,选取2017年11月份二氧化硫、二氧化氮、一氧化碳、PM2.5、PMio和臭氧的监测数据作为研究对象,通过与北京监测站——西城官园的监测数据对比发现,两地的各个指标变化趋势大体一致,说明传感器满足监测的精度要求。通过线性插值法和主成分分析分别构造空气质量指数和空气质量综合指数,发现两者的相关系数达到0.831,在一定程度上都能反映白塔寺街区的空气质量状况。与官园监测站的空气质量指数对比发现空气质量综合指数和官园空气质量指数的相关性更是高达0.883,特别是在11月2日、7日和22日指数大幅度下降时,空气质量综合指数和官园空气质量指数更加吻合。综上可知主成分分析比线性插值法更适合于白塔寺街区的空气质量研究,并建立新的评价等级,以切实反映白塔寺街区的空气状况。

关键词:空气质量;历史文化保护区;线性插值法;主成分分析;评价等级

中圖分类号:X8 20.2

文献标识码:A

文章编号:1674-9944(2018)4-0066-05

1 引言

历史文化街区是城市中宝贵的历史文化遗产,它承载了这个城市的传统意蕴和精神内涵。北京西城区内的阜内白塔寺历史文化街区(简称白塔寺街区)是北京旧城的典型样本,坐落其中的妙应白塔寺是我国现存最早、最大的喇嘛塔,周边的宫门口头条、白塔寺东夹道、苏萝卜胡同等构成了富有特色的“胡同风情”。但近几年来,由于市民机动车保有量的增加,机动车与非机动车混行、胡同乱停车现象普遍,环境卫生令人堪忧,随着“白塔寺再生计划”的实施,关注其发展建设的人越来越多。

目前我国大气污染正由以SOz和PMio为特征的煤烟型污染发展成多种污染物复合型污染[1-4],单一污染物的研究[5-7]已不能完全解释我国城市大气污染状况,空气质量的问题变得十分严峻。国外学者对空气质量的研究趋势是采用多种方法进行综合分析,如Powell和Lee[8]提出一种通用的贝叶斯层次框架,Bruno和Cocchic9]通过连续地应用一些聚合函数来合成空气质量指数。国内传统的计算方法是《环境空气质量标准》( GB 3095 -2012)[10]里的线性插值法,如对保定市、秦皇岛市和北京市的空气质量的研究[11—13]。潘本锋筹[14]发现此方法在应用中存在一些问题,并提出相应的改进建议。目前常用的空气质量综合评价方法包括综合指数法、灰色聚类法、模糊综合评价法、主成分分析法等,如姜新华等[15]基于主成分分析法对呼和浩特市的空气质量进行研究,得出主要影响因素为PM10、CO和S02。张茹[16]采用层次分析和主成分方法对徐州市大气监测数据进行研究,发现两种方法均可作为质量评价的方法。

由于国家监测站点有限且间距较大,很难做到监测指标的全区域覆盖。鉴于国测站造价高且分布不够精细等缺陷,北京市科委借示范项目系统建设的机会,在白塔寺街区内部署了60套CityGrid -体化传感器,实时采集多项大气环境数据,以便观察白塔寺街区的实时运行状态。作为阶段性成果,本文选取北京市监测站中距白塔寺街区最近的官园监测点作为对照,分别采用线性插值法和主成分分析进行统计建模,经分析发现主成分分析一方面能体现白塔寺街区的区域特点,另一方面和官园监测站更加吻合,说明主成分分析比线性插值法更适合白塔寺街区的空气质量建模。

2 主成分分析

很多情况下,在所研究课题的众多变量之间存在一定的相关关系,导致部分信息的重叠,同时变量个数过多也会增加研究的难度。主成分分析恰好能解决此类问题,其主要目的便是为了降维,基本思想是通过构造原变量的线性组合,以产生一系列互不相关的新变量,从中选出为数较少的新变量并使它们含有原变量所提供的大部分信息,从而使得用这几个新变量来分析问题成为可能。分析步骤分5步:首先,对原始数据进行标准化,以消除量纲的不同带来的影响;接着,计算样本协方差阵或相关系数阵;然后,求样本协方差阵或相关系数阵的特征值和特征向量,从而计算各变量的贡献率和累计贡献率;再后,确定主成分的个数(一般要求累计贡献率大于80%即可);最后,对所选择的主成分给出合理解释,计算主成分得分和综合得分。

3 实例应用与分析

3.1 数据来源与预处理

白塔寺街区的监测数据来自该街区范围内部署的60套CityGrid -体化传感器,该设备基于定电位电解传感器原理及激光检测技术监测污染气体、光散射原理检测粉尘的技术,可监测19项参数,包括:光照强度、紫外线指数、温度、湿度、风向、风速、PM2.5、PM10、大气压强、噪声、S02、NO2、CO、C02、03、VOC浓度、人流量、车流量、车速分析。

另一方面,了解到当前北京市西城区共建有2个用于采集空气质量指标数据的监测站,选择距白塔寺街区最近的官园监测站,从北京市环境保护监测中心网站上可收集北京市各监测站的空气质量时报数据(S02、NO2、CO、PM2.5、PM10、03、AQI).

白塔寺街区和官园监测站在地图上的位置如图1所示。

选取影响空气质量的六项主要污染物指标作为研究对象,首先对数据进行预处理,将60套监测设备的数据汇总,然后以小时为单位取平均值,得出白塔寺街区2017年11月的整体污染物监测情况,共收集720条数据,部分数据如表1。

3.2 白塔寺街区污染物指标的特征分析

首先对白塔寺街区污染物指标的监测数据进行逐一分析,并通过与官园的数据对比,得出白塔寺街区污染物指标的区域特征。通过R语言绘图,观察两地污染物浓度的变化规律,见图2。

图2为PM2.5、PMio、S02、NO2、CO、03的时间序列图,水平直线代表空气质量指数为100时对应的各污染物浓度限值。从图中可以看出,白塔寺街区在11月期间主要污染物为PM2.5,而PM10、S02和03只出现短暂的超标,NO2和CO浓度一直未超标。另一方面PM2.5和PMio波动较大,且具有同升同降的现象,而S02、NO2、CO、03的浓度变化相对稳定,且CO浓度有逐渐降低的趋势,整体上看,白塔寺街区的空气质量正在逐渐转好。经对比可知,白塔寺街区和官园监测点的为PM2.5、PM10、S02、CO的变化趋势保持高度一致,考虑到官园距白塔寺街区仅相隔1.2 km,此现象符合实际情况,说明传感器在精度上满足监测要求。

3.3 影响空气质量因素的主成分分析法

对污染物指标SO2 (Xl)、NO2 (Xz)、CO( X3)、PM2.5(X4)、PM10 (X5)和03(X6)进行主成分分析,首先计算各变量之间的Pearson相关系数,通过R语言编程实现,计算结果见表2。

从表2可以看出CO与N02、PM25、PMio的相关系数均在0.5以上,存在较强的相关性,另外PMz.s和PMio的相关系数高达0.996,这是因为PMio浓度中包含了PM2.5,两者的强相关与实际相符。接下来计算相关系数阵的特征值和特征向量,从而得到各主成分的贡献率和累计贡献率见表3。

依据表3的结果及累计贡献率大于80%的原则,选取前3个主成分进行分析,表达式如下:

Yl=- 0.0614Xl+0.3688X2 - 0.4920X3 - 0.5492X4 -0.5490X 5 +0.1231X 6

Y2=0.8558X1+ 0.4416X2- 0.0 918X 3+0.1216X 4+0.1196X5 -0.1872X 6

Y3=-0. 2169X1+0.0637X 2+0.0267X3 - 0.094]X 4 -0.0794X 5 -0.9659X 6

这里总共选取了三个主成分,第一主成分包含了47.1%的信息量,主要代表因素是PM2.5和PMio,反映了空气中微小颗粒物的浓度;第二主成分包含17.8%的信息量,代表因素为二氧化硫;第三主成分包含了16.3%的信息量,代表因素为臭氧。由此可见,空气质量的主要影响因子包括PM25、二氧化硫和臭氧。

以各主成分相应的贡献率作为权重求和,即Z=0.4710 Y1+0.1778Y2+0.1629Y3,将Yl、Y2、Y3代入可得

Z=0.0879X1+0.2626X 2 - 0.2437X 3 - 0.2524X 4-0.2502X 5 -0.1326X 6

将上式的系数进行标准化得出污染物指标的权重,可得空气质量综合指数AQCI模型为:

F=0.0276X1+0.2463X 3+0.2121X 3+0.2275X 4-l-0.2237X5+0.0629X6

3.4 影响空气质量因素的线性捶值法

本节针对白塔寺街区的污染物指标监测数据,根据《环境空气质量指数(AQI)技术规定(试行)》(HJ633-2012)的空气质量分指数IAQI及对应的污染物项目浓度限值,通过构造S02、NO2、CO、PM2.5、PM10、03的1h平均,PM2.5和PM10的24 h滑动平均和03的8h滑动平均这9个指标进行建模,根据线性插值法可知,污染物指标P的空气质量分指数IAQIP计算公式为:

其中IAQI表示空气质量分指数,n表示污染物项目的数量。

将监测数据带入式(1),用R语言统计软件编程实现,可得到空气质量指数AQI和首要污染物,其中11月份白塔寺街区首要污染物的频率见表4。

从表4可以看出,白塔寺街区首要污染物为PM2.5的频率为0.947,其次是03,频率为0.031,说明PM2.5是白塔寺街区空气污染的主要来源。

3.5 结果分析

首先分析白塔寺街区AQCI、白塔寺街区AQI与官园AQI的相关性,计算三者之间的Pearson相关系数见表5。

从表5可以看出白塔寺街区AQCI、白塔寺街区AQI的相关系数为0.831,说明两种方法的相关性很强,在一定程度上都能用来作为白塔寺街区的空气质量分析模型。而当与官园AQI进行对比时,发现AQCI与官园AQI的相关性更强,为0.883,鉴于白塔寺街区距官园仅1.2 km,而国测站要求监测能反映周围5 km的空气状况,因此主成分分析更适用于白塔寺街区的空气质量建模,下面画出三者的折线图,结果见图3。

从图3可以看出与线性插值法相比,主成分分析得出的AQCI与官园监测站AQI更加贴合,特别是在2、7和22日空气质量指数大幅度下降的时候,AQCI与官园的下降斜率基本相同,而插值法得到的AQI下降的相对缓慢,鉴于线性插值法仅以最大污染物的空气质量分指数为准,而实际生活中,次大污染物对空气质量的影响也不容小视,而主成分分析方法能综合各个污染物指标分析计算,更适合白塔寺街区的空气质量建模。另一方面,无论是线性插值还是主成分分析,得出的白塔寺街区空气质量数据在19~22日都比官园的低,这是因为据中国新闻网11月20日报道:根据环保局空气质量预报和实时监测情况,目前,京津冀地区污染扩散条件不利,北京市受区域性逆温、西南风传输及叠加本地排放影响,预计今日夜间至明日傍晚空气质量将达到重度污染水平,故官园污染较严重。由于主成分分析得出的AQCI相对较小,将其扩大两倍,见图4。

從图4发现,扩大两倍的AQCI与官园的相似性更加明显,且基本量纲相同,据此根据《环境空气质量指数(AQI)技术规定(试行)》(HJ633 - 2012)的分级方法,将其标准缩小一半,制定为白塔寺街区的评价等级,见表6。

4 结论

通过分析发现,用低成本的传感器设备监测的白塔寺街区污染物指标数据和北京官园的数据变化趋势基本保持一致,在精度上达到监测的要求,同时白塔寺街区具有自己的区域特征,如PM2.5和PM10浓度值相对较低,其它污染物浓度变化较平稳。分别采用线性插值法和主成分分析法得出空气质量指数和空气质量综合指数,发现两者高度相关,相关系数达到0.831。但主成分分析方法与官园空气质量指数的变化幅度更加贴合,相关系数也比较高,为0.883。且受区域性逆温、西南风传输及叠加本地排放影响,官园的污染较重,而无论是线性插值法还是主成分分析法,都能准确反映这一变化,得出的白塔寺街区空气质量数据都比官园的低。整体上看,主成分分析法一方面能体现白塔寺街区的区域特点,另一方面和官园监测站更加吻合,因此主成分分析法比线性插值法更适合白塔寺街区的空气质量建模,最后为空气质量综合指数制定新的评价等级,以切实反映白塔寺的空气状况。

参考文献:

[l]Chen C K, Yao X H.Air pollution in mega cities in China [J]. Atmospheric Environment, 2008, 42(1):1~42.

[2]Deng X J,Tie X X,Wu D,et al.Long-term trend of visibilityand its characterizations in the Pearl River Delta (PRD) region,China [J]. Atmospheric Environment, 2008, 42(7):1424~1435.

[3]Gao L N, Jia G S,Zhang R J,et al.Visual range trends in theYangtze River Delta region of China during 1981- 2005 [J]. Journal of the Air&Waste Management Association, 2011, 61(8):843~849.

[4]许亚宣,李小敏,于华通,等,邯郸市大气复合污染特征的监测研究[J].环境科学学报,2015,35(9):2710~2722.

[5]奇奕轩,胡 君,张鹤丰,等,北京市郊区夏季臭氧重污染特征及生成效率[J].环境科学研究,2017,30(5):663~671.

[6]夏泽群,范小莉,黄志炯,等,国内外PM2.5源谱对比及其对空气质量模拟效果的影响[J].环境科学研究,2017,30(3):359~367.

[7]Chen P F, Bi X H, Zhang J Q, et al_Assessment of heavy metalpollution characteristics and human health risk of exposure to ambient PMz.s in Tianjin, China [J]. Particuology, 2015, 20(3):104~l09.

[8]Powell H, Lee D.Modelling spatial variability in concentrations ofsingle pollutants and composite air quality indicators in healtheffects studies [J]. Journal of the Royal Statistical Society, 2014,177(3):607~623.

[9]Bruno F, Cocchi D.A unified strategy for building simple air quality indices [J]. Environmetrics, 2010, 13(3):243~261.

[10]中华人民共和国环境保护部,中华人民共和国国家质量监督检验检疫总局.环境空气质量标准:GB 3095-2012 [S].北京:中国环境科学出版社,2012.

[11]赵静,齐芳,张辉,等.保定市空气质量现状及综合治理措施[J].河北建筑工程学院学报,2014,32(1):55~59.

[12]冯建社,张婷,张明月,等.秦皇島市空气质量指数AQI现状分析[J].中国环境管理干部学院学报,2014,24(5):65~69.

[13]刘杰,杨鹏,吕文生,等.基于北京市6类污染物的环境空气质量评价方法[J].安全与环境学报,2015,15 (1):310~315.

[14]潘本锋,宫正宇,王帅,等.环境空气质量指数在应用中存在的问题及建议[J].中国环境监测,2015,31(1):64~67.

[15]姜新华,薛河儒,张存厚,等.基于主成分分析的呼和浩特市空气质量影响因素研究[J].安全与环境工程,2016,23 (1):75 ~79.

[16]张茹,张学杨,陆洪光,等.基于层次分析和主成分分析的城市空气质量评价——以徐州市为例[J].安全与环境工程,2017,24(3):103~107.

猜你喜欢
主成分分析空气质量
乌海市雾对空气质量的影响
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
服务贸易结构优化路径研究
看雾霾新闻,为提高空气质量支招