基于CMPAS的“韦帕”台风过程降水真实性评估

2024-01-11 00:45陈逸智郑艳萍张春燕王沛东邓若钊
广东水利水电 2023年12期
关键词:格点降水量站点

陈逸智,郑艳萍,张春燕,王沛东,侯 灵,邓若钊

(1.广东省气象数据中心,广州 510000;2.广东省遂溪县气象局,广东 遂溪 524300)

1 概述

近年来,为解决地面观测站点分布密度逐渐无法满足精细化预报需求的问题,将地面观测降水量与雷达卫星等多种产品融合逐渐成为了国际社会在高质量降水产品研制中的主流趋势[1],而国内外学者也对融合后空间分辨率更高的格点降水产品的可靠性进行了各方面评估和订正[2-7]。我国多源融合降水数据的研究以国际先进的融合技术为基础,消化吸收并自主创新,逐步形成了自己的数据同化和数据融合体系。国家气象信息中心师春香团队经过对融合技术的发展和完善,2009年来发布了基于中国气象局多源融合降水分析系统(CMPAS)的二源(地面、雷达)和三源(地面、雷达、卫星)融合降水产品[8-10]。此外,也有不少学者针对本地特点及不同插值方法做出了各种特色的融合产品,丰富了国内对多源融合的研究[11-16]。

为了提升实况产品基础服务能力,国家气象局定制实况业务建设实施方案,要求加强实况检验评估,以指导用户正确使用数据。在下发产品后,多省对产品在本地的适用性进行了评估,旷兰等[17]对重庆复杂地形下的多源融合分析产品做了检验评估,结果显示随着降水等级增大,产品的误差、相关性以及TS等级评分的分布越离散;李超等[18]基于2018—2020年云南省126个国家地面观测站逐小时降水资料,客观定量评估了CMPAS二源和三源产品在云南地区的适用性,结果表明两套融合降水产品均能较好地反映云南区域小时降水的时空变化特征,但都低估了实际降水量,且三源融合降水产品在云南的适用性更强;黄勤等[19]的研究也证明多源融合产品在陕西区域存在一定低估,但总体上与实测降水相关性较好。

广东省历来强降水多发,降水过程丰富多样,且地形复杂多变,实况融合降水产品能否真实反应区域降水分布,在预报业务应用之前亟待论证。本文将检验源数据站点气象要素观测数据作为“真值”,采用自然临近的插值方法,选择距离站点最近的网格实况值插值到观测点,统计比较一段时间内两者的误差或相关关系,以期为实况融合的业务应用能力提供数据支撑。

2 数据和方法

2.1 数据描述

2.1.1被检验产品描述

此次降水网格产品真实性评估的对象是业务准入的多源融合实况分析产品(CMPAS_1km)中的降水产品,空间范围为109.30~117.50°E,19.91~25.69°N(格点数:821×579),时间跨度为2019—2021年5—10月,2022年5—8月,空间分辨率为0.01°×0.01°,时间分辨率为逐小时,所使用的融合资料包括地面、卫星、雷达等多源数据。

2.1.2检验源数据描述

检验源数据包括独立检验源和非独立检验源。非独立检验源包括86个国家站和2 999个上行国家气象信息中心的考核与非考核区域自动站。

所使用的非独立检验源进行了省级本地化质量控制:在MDOS质控[20]的基础上,广东省气象数据中心分析了省内多区域雨量时空分布特征[21],结合自动观测雨量站站网分布特征,设计适用于广东降水量的空间一致性质量控制方法,采用临近站“配合”法与Madsen-Allerupt 方法结合的质控方法针对偏大雨量进行质控,采用二次多项式拟合法对偏小雨量进行检查,对空间一致性判断为疑误的数据,设计S波段双偏振雷达组合反射率协同检查方案,大大减少了疑误数据漏检、误检问题。

独立检验源数据为经质量控制后的2019年广东省范围内共计4 449个地面雨量站数据,包括2 431个未上行非考核区域自动站(见图1)和2018个水文雨量站(见图2),逐时的降水量要素质控方法与非独立检验源数据质控方式相同。

图1 2019年广东省未上行区域站分布示意

图2 2019年广东省水文站分布示意

2.2 检验方法

2.2.1误差指标

平均值误差(ME):

(1)

均方根误差(RMSE):

(2)

平均绝对误差(MAE):

(3)

相关系数(COR):

(4)

平均相对误差(MRE):

(5)

式中:

Oi——站点观测值;

Gi——实况分析产品插值到检验站点得到的数值;

N——参与检验的总样本数(站次数)。

降水分级检验的逐小时降水量等级划分见表1所示。

表1 逐小时降水量等级划分

各个降水级别的误差指标计算,其样本为观测降水量在该级别内的实况和观测样本,其计算方法参照公式(1)~(5)。

2.2.2传统检验评分

技巧评分(TS):反映预测正样本与观测正样本的对应程度如何,其计算公式为:

(6)

相当技巧评分(ETS):反映预测正样本与观测正样本的对应程度如何,其中扣除了随机预报产生的命中数量,其计算公式为:

(7)

命中率(POD):反映观测的正样本中多少被预报,其计算公式为:

(8)

空报率(FAR):反映预报的正样本中实际未发生的比例,其计算公式为:

(9)

漏报率(MR):反映观测正样本被预报为负样本的比例,其计算公式为:

(10)

频率偏差(BIAS):反映预报的正样本数和观测的正样本数的比值,其计算公式为:

(11)

式中:

NA——产品与站点均有降水的数量;

NB——产品有降水,但站点无降水的数量;

NC——产品无降水,但站点有降水的数量;

ND——产品与站点均无降水的数量;

R(a)——随机预报产生的命中数量。

3 产品质量评估

3.1 过程总体评估

第7号台风“韦帕”是2019年登陆广东省的首个台风,具有“近海生成、强度较弱,路径曲折、移速多变,降水明显、风力较小”的特点。受“韦帕”影响,广东省中南部市县普遍出现了暴雨到大暴雨,其中湛江、茂名、云浮、阳江、江门、珠海等市出现了局地特大暴雨,湛江雷州市龙门镇录得全省最大累计雨量396 mm;广东省沿海市县和海面出现了8~9级、阵风10~12级的大风。7月31日到8月2日白天,广东省中南部市县普遍出现了暴雨到大暴雨,其中湛江、茂名、云浮、阳江、江门、珠海等市出现了局地特大暴雨。7月31日08:00到8月02日17:00,全省平均雨量为78.3 mm,降雨量超过25 mm的站点占全省总站数的68.5%,有119个站录得超过250 mm的累计雨量,有1 579个站录得100~250 mm的累计雨量,有1 066个站录得50~100 mm的累计雨量。

图3中格点和站点的累计降水分布显示,格点产品和站点降水集中区域有较大差别,格点产品在部分区域的降水量级表现出不同程度的偏小和偏大。在降雨较小的粤中地区(清远、河源、韶关等地),格点产品普遍显示降雨超过50 mm,而站点真值大部分处于50 mm以下;在降水大值地区(江门、阳江、茂名、湛江),格点产品的降水又明显偏小,未能复现出站点真值,在阳江和江门地区超过400 mm的降水极值区,且对于累计降水处于250~400 mm的次极值地区复现效果也不佳。

a 格点累计降水

各个降雨量级的频率分布(见图4c~d)显示,CMPA1km出现无降水(小于0.1 mm)的频率相比未上行区域站和水文站要低一些,出现1级降水的频率则比未上行区域站和水文站高一些,尤其是水文站,这种现象更明显。这表明,站点实测无降水的某些时候,CMPA 1 km会出现弱降水,但这种情形较少。其他等级降水的出现频率,CMPA 1 km和实际观测差不多。从散点图上看,该个例中,未上行区域站、水文站的CMPA 1 km与观测逐时降水在20 mm以下时相对更接近,在20 mm以上差距更大,表明CMPA 1 km降水产品在强降水情况下存在更大偏差。而散点图中(见图4a~b),越接近红色直线的点表示格点值距离站点真值的偏移越小,可以看出非上行区域站和水文站的格点值距离真值的偏移在整个过程中没有明显区别。

a 非上行区域站

3.2 过程误差分析

从各项误差分布(见图5)可以看出,非独立检验中(见图5a~d),各指标的表现都很好,趋近于没有误差。而在独立检验中(见图5e~l),在茂名、江门、湛江这几个降水集中区域,误差相比周围区域明显偏高,尤其是MAE和MRE的分布偏高更加明显,而这几个区域对应的是该过程累计降水的极值区,即从结果中可以看出,误差量与降水量呈明显的正相关。相关系数在降水大值区偏高,在水文站的相关系数分布图(5h)中表现更为突出,但在降雨大值区和小值区的交界部分(粤中区域),相关系数明显偏低。

而误差指标(见表2)显示,非独立检验的误差明显比独立检验小,差距在一个数量级以上,独立检验的误差(包括MAE和RMSE)从20 mm量级开始迅速上升,误差与降水量级呈正相关的趋势,且通过ME可以看出,格点产品在大部分情况下均比站点值偏小,且偏小程度与降水量级成正比。相关系数则是在不分级的情况下表现较为良好,独立检验在0.8以上,但是在各降水量级情况下均表现不佳,在50 mm以上极端强降水表现最差。

表2 独立检验和非独立检验在各个降水等级(mm)上的MAE、ME、RMSE、COR分布

3.3 过程评分分析

综合评分图(见图6)显示,越靠近右上角的点评分越高,非独立检验的综合评分均接近于满分,而独立检验方面水文站的综合评分略微优于非上行区域站。在不同降雨量级上,20 mm以下量级的综合评分与降水量呈负相关,即在0~20 mm范围内降水量越大,综合评分越低;而当降水量超过20 mm时,综合评分有较为明显的上升。

a 国家站

各雨量等级的评分分布(见表3)显示,在独立检验中,各评分指标几乎都随降雨量级的增加呈下降趋势,TS评分和命中率的下降最为明显,空报率在所有降水量级都很高,且在50 mm以上的降水区间最高;频率偏差在10 mm以下的雨量没有明显变化,但超过10 mm后也出现明显的下降。TS评分则明显与降水量级呈负相关,非独立检验的各项评分显著高于独立检验。

表3 独立检验和非独立检验在各个降水等级上的TS、ETS、POD、FAR、MR、BAIS分布

3.4 站点误差分析

对于单站误差,本次研究选取了过程中两个格点值偏差最大的独立检验站点进行分析,从这两个站点的时序图(见图7)可以看出,格点产品正确反映出了降水极值出现的时间,但是在极值处格点值明显小于站点值,而较小量级降雨时段的格点值与站点值基本持平,证明格点值的误差主要出现在极值时段。

a 水文站

表4显示,过程中偏差最大的独立检验站点me和mre均为负值,与图7和表2的现象一致,再次证明了格点产品存在总体比站点真值偏小的情况,而相关系数虽然比非独立检验明显偏小,但在独立检验中属于较高水平。

表4 格点和站点值差距最大的水文站和非上行区域站的误差分布

4 结语

本文基于国家气象信息中心下发的实况分析降水融合产品(CMPAS),使用质量控制后的站点降水作为真值,评估了降水融合产品在“韦帕”台风过程中的融合效果。结果表明:

1)格点产品大体反映出了实际的降雨分布,但未能准确反映出降水极值所在区域,且降雨大值区与误差大值区基本重合;在独立检验中,格点产品与站点产品的相关系数总体较低,但在大雨量区域相关系数较高。独立检验的误差从20 mm量级开始迅速上升,误差与降水量级呈正相关的趋势,格点产品在大部分情况下均比站点值偏小,且偏小程度也与降水量级成正比。

2)各评分指标几乎都随降雨量级增加呈下降趋势,TS评分和命中率的下降最为明显,空报率在所有降水量级都很高,且在50 mm以上的降水区间最高;频率偏差在10 mm以下的雨量没有明显变化,但超过10 mm后也出现明显的下降;非独立检验的综合评分显著高于独立检验。

3)对误差最大的单站评估显示,格点值总体小于站点值,且在极值处偏离最明显;该站点对应的格点值正常反映出了降水极值出现的时间,与整个过程的趋势一致。过程中偏差最大的独立检验站点相关系数不高,但是在独立性检验整体中属于较高水平。

4)综合评估结果,该实况融合产品对降水的空间分布、时间分布和大值区范围有较好的刻画能力,但对于极值大小和区域的刻画不太精准,同时表现出误差随降水量的增加而增大的趋势。所以该产品可以用于较小量级降水的落区预报以及站点降水极值出现时间的预报,但是对于强降水过程的预报需慎用。

猜你喜欢
格点降水量站点
带有超二次位势无限格点上的基态行波解
一种电离层TEC格点预测模型
降水量是怎么算出来的
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
带可加噪声的非自治随机Boussinesq格点方程的随机吸引子
黄台桥站多年降水量变化特征分析
1988—2017年呼和浩特市降水演变特征分析
首届欧洲自行车共享站点协商会召开
怕被人认出