基于SVR的多因素气候变暖分析

2021-06-06 23:03尚梦琦
中国新通信 2021年1期
关键词:气候变化

尚梦琦

【摘要】    气候变暖是人类的共同威胁,对气候及极端天气相关数据的分析有助于加深人们对全球变暖的理性认识。本文以加拿大为例,结合数据挖掘技术,使用支持向量回归(SVR)方法对目标地区的温度情况进行分析与预测,探索气候变化规律,为共同应对全球变暖提供帮助。

【关键词】    全球变暖    SVR    气候变化

Abstract:Climate warming is a common threat to mankind, and the analysis of climate and extreme weather related data can help deepen peoples rational understanding of global warming. This article takes Canada as an example, combined with data mining technology, uses support vector regression (SVR) methods to analyze and predict the temperature in the target area, explore the laws of climate change, and provide help for the joint response to global warming.

Keywords: Global warming; SVR; climate change

引言

溫室效应不断增加,导致地气系统能量失衡,而这些不平衡的能量在地球积聚,导致温度上升,造成全球气候变暖。这一问题的出现,为世界气候带来了相当的影响,例如冰川和冻土消融、海平面上升、极端天气的出现等等。这些不仅会影响自然生态的平衡,也威胁着人类的生存环境。因此,通过相关数据找出温室效应与全球气候变化之间的关系,并由此预测未来温度的变化具有现实意义。

一、数据来源

根据文献调研结果发现,可能影响气候变化的因素有:二氧化碳排行量、人口数量、GDP等。由于气候是长时间内气象要素的统计状态,选择以年为单位进行分析。建模数据来自世界银行公开数据和加拿大政府网站。

二、基于SVR的温度预测模型

支持向量机回归是基于统计学习理论和结构风险最小化原理而提出的一种由监督的新的机器学习方法,适合小样本下的统计学习分析。因此,本实验采用如图1所示的技术路线进行研究分析。

2.1特征选择

考虑到现有的数据集中包含的特征,选择1960年至2018年的数据,同时加入了季节因素,建模采用的特征分别是:人口、人均二氧化碳排放量、国内生产总值、春季气温偏移量、夏季气温偏移量、秋季气温偏移量和冬季气温偏移量。

2.2数据预处理

数据预处理工作主要包括数据清洗和数据归一化。

1、数据清洗

由于数据集中存在缺省值、异常值等,模型建立之前一般要进行数据清洗工作,剔除异常值,利用均值填充缺省值。

2、数据归一化

由于不同特征的变化量级存在较大差异,为了便于分析和研究,消除数量级不同对模型的影响,基于均值和标准差对数据进行标准化处理。标准化方法如公式1所示:

其中,xi是原始特征数据,μ为对应特征的均值信息,σ为标准差,标准化后的数据符合正态分布。

3、数据集划分

为了避免模型过拟合,首先将数据集打乱,之后将80%的数据作为训练集用于训练模型,20%的数据作为测试集用于模型优化与评估。

2.3 SVR模型构建

1、SVR 原理分析

SVR模型通过非线性核函数将特征数据映射到高维度空间G,然后在高维空间中进行线性回归,如公式2所示。

2、核函数选择

目前主流的核函数主要有:线性核函数、多项式核函数和高斯核函数,考虑到目前可用的数据量并不是很大,而且避免核函数映射到无穷维空间导致模型构建的失败,因此,选择使用较为简单、易于处理小型数据集的线性核函数,如公式3所示。

3、拟合模型

将训练集数据带入模型,训练后的温度模型中各个特征的权重值如表1所示。

可以发现除了四季温度的偏移,二氧化碳的排放量也显著影响着年气温的偏差。

2.4模型优化与评估

使用测试集评估模型的泛化性能,为了使模型达到最优效果,采用GridSearch网格搜索方法尝试参数的可能组合,找到最佳参数值。

针对构建的SVR温度预测模型,其中有两个重要的参数,核宽度gamma和正则化参数C。gamma值在一定程度上决定了数据在新特征空间的分布情况,而正则化参数C用于降低模型拟合的风险程度。根据sklearn库中提供的GridSearchCV包,找到了最佳模型参数值:gamma=0.2,C=0.1。

之后使用新参数构建模型,可以获得较高的拟合精度,训练集精度为0.85,测试集精度为0.845。

四、结果分析

为了便于对结果进行预测分析,我们将原始数据信息和通过SVR温度预测模型得到的温度值绘制在一张图上,如图2所示。其中蓝色折线为原始年气温偏差,红色折现为SVR预测的年气温偏差,可以发现模型的拟合效果较好。

五、结语

本文通过建立SVR温度预测模型,探索和分析温度与多因素的关系,可以发现随着近年来各个国家的快速发展与人口剧增,人类活动已经影响到地球原生的气温变化,如果不对二氧化碳的排放量加以限制,则会加快全球变暖的趋势。

参  考  文  献

[1] 热伊莱·卡得尔,伊卜拉伊木·阿卜杜吾普,陈刚.全球气候变化及其影响因素研究进展[J].农业开发与装备,2020(09):81-82.

[2] 赵宗慈,罗勇,黄建斌.全球变暖与气候突变[J/OL].气候变化研究进展:1-10[2020-11-09].

[3] 牛书丽,陈卫楠.全球变化与生态系统研究现状与展望[J].植物生态学报,2020,44(05):449-460.

猜你喜欢
气候变化
《气候变化》的披露要求与趋同分析
潮细胞
Exploring the link between education and climate change 教育和气候变化之间有何联系
年轻人最担忧气候变化
“停战”
气候变化成为澳年轻人最重视问题
2007:绿色企业
WHO:每8例死亡中就有1例死于空气污染
谷歌数据显示:美国人不懂气候变化