资源型城市聚集区域PM2.5 影响因子分析

2024-02-27 11:51李红雨
资源节约与环保 2024年1期
关键词:资源型平原排序

李红雨

(成都理工大学数学地质重点实验室 四川 成都 610051)

引言

资源型地区是指依赖于本地区矿产、森林等资源的开发利用而发展并且以资源型产业为重要支撑的特殊地区。自2013 年《全国资源型城市可持续发展规划(2013-2020)》正式发布以来,资源型城市地区的发展基础不断地改善,在产业发展、城市发展和社会民生等多方面都取得了显著的成效。但资源型城市的主要产业一般是高污染、高消耗的产业,导致了生态环境污染问题的显露。

2021年《推进资源型地区高质量发展“十四五”实施方案》正式获批复,其中着重提到了推动新时代资源型地区绿色发展的多项要求[1]。张文忠[2]提出要推进资源型城市的生态文明建设,让生态环境千疮百孔的资源型城市的天更蓝、山更绿、水更清、环境更优美,迈向生态文明新时代。

以资源型城市聚集的代表性区域汾渭平原为例,自2018 年6 月起汾渭平原被列为全国环境空气质量状况三大重点区域之一,因此研究汾渭平原大气污染变化规律对改善全球资源型地区生态环境、建设生态文明具有重要的意义。通过文献的总结,发现研究者们已经找到多个因素去探求影响大气污染的原因,有助于从不同的方面去改善大气污染问题。基于此,本文着眼于研究资源型城市群PM2.5多个影响因素的重要性排序,首先对该地区PM2.5的时空特征进行简要介绍,再对初步选取的15 个变量进行相关性分析,筛除掉部分相关性过强的变量后,最后对剩余的12个影响因素进行随机森林特征重要性排序,探寻对浓度值变化影响最大的因素。

1 研究区概况、数据来源及数据预处理

1.1 研究区概况

汾渭平原是黄河流域汾河平原、渭河平原及其周边台塬阶地的总称,包括了陕西省的西安、宝鸡、咸阳、渭南、铜川,山西省的晋中、吕梁、临汾、运城,以及河南省的洛阳、三门峡11 个地级行政区,属于综合性资源型城市聚集区域。汾渭平原于2018 年6 月起被生态环境部列为大气污染重点区域,根据最新数据,汾渭平原合计土地面积为153256km2,常住人口约5024 万人,是黄河中游地区最大的冲积平原,气候为温带季风性半湿润区气候。本文选择汾渭平原作为研究区。

1.2 数据来源及数据处理

目前,针对于汾渭平原整体的统计数据并不多,本文通过其所处的地级市数据来整理出区域数据,详见表1。PM2.5年均浓度数据主要参考LIU H等[3]的数据集,填补了目前研究中2013 年以前PM2.5浓度数据的缺失。

表1 数据来源

根据资源型城市产业特点及相关的总结,最终选取了15 个变量,其中自然因素主要对污染物的传输扩散、二次生成以及吸收沉降有紧密的联系,而其他4个方面主要与污染物的产生相关[4]。部分数据存在少量缺失值,选择了传统的缺失值填补方法。

1.3 随机森林特征重要性

目前,研究中有多项因子被证实对PM2.5有显著影响。本文主要探讨资源型城市污染物各影响因素的重要性,而随机森林特征重要性计算方法正广泛运用于各个领域,旨在从多个特征当中寻找到对结果或研究目标影响最大的几个特征。随机森林进行特征重要性评估的思想主要是通过计算每个特征在随机森林中各组决策树上所做的贡献,取平均值,最后比较特征之间的贡献大小,目前常用基尼指数或OOB 作为评价指标[5]。本文选择基尼指数作为评价指标。

以VIM表示变量重要性评分,GI表示Gini指数,假设m 个特征X1,X2,X3,…,Xm,按式(1)计算出每个特征Xj的Gini指数评分。

式中K—K个类别;Pmk—节点m中类别k所占比例。

特征Xj在节点m的重要性,即节点m分枝前后的Gini指数变化量见式(2)。

式中GIl、GIr—分枝后两个新节点的Gini指数。

假设特征Xj在决策树i中出现的节点在集合m中,Xj在第i颗决策树重要性,计算见式(3)。

假设在所建立的随机森林中有n颗树,计算见式(4)。

归一化处理,计算见式(5)。

2 汾渭平原PM2.5 时空特征

2.1 时间演变

2000~2020 年汾渭平原所处的11 个地级市的PM2.5浓度年均值变化情况如图1 所示。整体上看,各地级市变化趋势基本一致,2000~2004年变化比较平缓,无明显的上升下降趋势,其中宝鸡上下波动最大。2004~2008 年各区域都有比较明显且统一的波动,前3 年呈上升趋势,其中运城在2006 年最高达到年均PM2.5浓度约72.05μg·m-3,而汾渭平原当年区域均值约62.01μg·m-3,为2000~2015 年均浓度最高的年份。此外,自2012 年起,各城市PM2.5年均浓度值都有比较剧烈的变动,在2013 年短暂的上升后都在2014 年得到控制,有所下降,而2014~2017 年各城市都有较大的上升趋势,其中临汾最高上升到约81.99μg·m-3,汾渭平原全区PM2.5浓度年均上升到66.63μg·m-3左右,为近21 年最高。2017年后,该区域的污染物得到有效控制,PM2.5年均浓度均持续下降,除各年下降速率不同外,均在2020 年达到近21 年PM2.5污染物含量最低,其中下降最多的为临汾,从2016 年的年均81.98μg·m-3下降到2020 年35.74μg·m-3。

图1 汾渭平原时间演变

2.2 空间演变

选取汾渭平原2000~2020 年间相同间隔年份的大气污染物PM2.5浓度进行空间演变分析,具体污染物浓度分布如图2 所示。2000~2020 年汾渭平原各区域PM2.5浓度分布差异较大,高值区域主要集中在汾渭平原中部,低值区域主要集中在北部。整体看,全区的年均PM2.5浓度值在2000~2015 年间都有一个显著的上升趋势,在2015~2020 年间均有较大的下降趋势。2000 年PM2.5浓度值高的区域主要集中在汾渭平原西部和中部地区,以咸阳、渭南和西安较为严重,北部地区和东部地区情况良好;2005 年污染物浓度值高的区域有所转移,逐渐从中、西部转移到中部及偏北地区,咸阳与运城成为污染物高值重点区域;2010 年所有区域均在2005 年的基础上有轻微的上涨,尤其以咸阳与运城周边的城市上涨较为明显;2015年所有区域浓度值上涨更加明显,浓度高值区域由局部拓展到所有区域,三门峡与洛阳所在的东南部成为浓度值最高的区域;2020年汾渭平原整体好转,污染浓度下降至最低。

图2 汾渭平原PM2.5 浓度分布图

3 汾渭平原PM2.5 影响因素分析

3.1 相关性分析

特征重要性排序之前需要对各特征进行相关性分析,尽量消除两两变量之间的相关性,再通过随机森林进行特征的排序及筛选。因此,先对15 个影响因素进行相关性分析,将相关性较高的变量筛选。通过相关系数,发现部分影响因子之间有着强相关的关系() 。在15 个变量中,保留了与其他因素均不相关或者弱相关的年均降水、年均气温、年均日照时数、全要素生产率及工业烟尘排放量5 个因素;人口密度只与其中2 个因素较相关且未达到极强相关(),因此将其全保留;考虑到区域特点,对地区生产总值、第二产业增加值、能源消耗总量、财政预算支出和科学及教育支出5 个因素进行保留。因此,总共剔除掉相关系数最高的3 个因素,保留了12 个因素。

3.2 基于随机森林的重要性排序

特征选择能够有效降低数据维度,适用于高维度小样本的数据训练[6]。因而,将PM2.5年均浓度作为被解释变量,以筛选过的12 个影响因素作为解释变量,通过随机森林构建模型,以此来探究所选的自然、社会经济、资源、财政、科教5 个方面对大气污染物PM2.5浓度的影响。由于2021 年、 2022 年各变量的缺失值过多,填补后效果极差,因此选取的分析时段为2000~2020 年。随机森林模型构建中参数选择依照平均绝对误差最小且计算量较小的原则(选取参数为88),模型拟合优度约58.35%,详见图3。

图3 重要性排序

图3a 为PM2.5浓度值作为被解释变量时,使用随机森林对12个变量进行重要性排序的结果,判定排序中靠前的影响因素为PM2.5浓度值的主要影响因素。从整体来看,自然因素的4 个变量相较于其他变量总体重要性均更高,尤其是气象因素中的年均气温重要性占到了第1,而归一化植被指数、年均降水、年均日照时数分别排在第2、第4、第6,属于重要性较强的影响因素。其他4个方面的影响因素中除人口密度和全要素生产率外,重要性都较低且差异不大。

人类社会中对自然因素所能进行的控制非常有限,且大部分自然因素也需要通过人类的社会活动来进行改善,因此在上文的基础上将自然因素的影响因子剔除,单独对除自然外的其他4 个方面的影响因素进行了重要性排序。依照原则与上文一致,模型拟合优度71.32%,具体排序如图3b。在这4 个方面当中,社会经济因素占主导地位,人口密度重要性尤为明显,全要素生产率与工业烟尘排放量紧随其后。但从图3b 中可以看出,影响因子相互之间的相关性过强导致8 个影响因子被明显划分成5 个等级,除人口密度和科学及教育支出外,中间3 个等级的每个等级中的2 个影响因子重要性差距非常小。因此,在对主导影响因素进行选择时,不能单纯以排序为主,要尽量将重要性差距过小的影响因素再筛选。

结论

研究期内,汾渭平原PM2.5浓度变化显著。通过分析该区域PM2.5的时空分布特征可知,2018~2020 年污染防治工作极大控制了污染物。自然影响因子整体重要性较强。在5 个大方面中,自然因素的影响因素重要性排序均靠前,但气温、植被覆盖度是所选变量中最重要的,而在其他方面人口、工业、能源仍是主导影响因子,排除自然变量后,社会经济占主导地位,但部分因素重要性差距不大,在特征选择时还需注意。

猜你喜欢
资源型平原排序
那一片平原
江淮平原第一关——古云梯关探秘
排序不等式
平原的草
恐怖排序
资源型城市——湖南涟源市,未来可期
浪起山走
节日排序
资源型城市绿地系统规划探讨
山西资源型经济转型将有大动作