中国区域性大气加权平均温度线性模型精度评估

2021-05-22 01:22王明华曹云昌梁宏涂满红刘志刚
南京信息工程大学学报 2021年2期
关键词:参考值测站线性

王明华 曹云昌 梁宏 涂满红 刘志刚

0 引言

全球导航卫星系统(Global Navigation Satellite System,GNSS)信号在穿越对流层时,会产生一定的延迟,利用该延迟量可以反演大气的重要参数——大气可降水量(Precipitable Water Vapor,PWV)[1-2].由于具有成本低、时空分辨率高、无需校准和可全天候工作等优点,GNSS已逐渐成为水汽探测的一种重要手段,在科学研究和气象业务中得到广泛应用[3-8].

在将GNSS信号对流层湿延迟转换成PW时,需要已知大气加权平均温度(Tm)数值.Tm是水汽转换过程中的一个关键参数,其精度决定着转换系数的精度[9].根据定义式计算Tm,需要获取各气压层(或高度层)的水汽分压和大气温度,并在高度上进行积分[10],应用上较为不便.实际中,常根据地表气温Ts与Tm线性关系来计算Tm.Bevis等[11]采用北美地区13个探空站2年的数据(8 718条廓线数据)拟合出一个线性模型Tm=0.72Ts+70.2,模型的拟合精度为4.74 K,该模型曾被作为标准模型,在全球多个地区使用.然而,文献[12-13]的研究表明,不同地区的Tm-Ts线性关系存在明显的差异性,以单一的Bevis模型代表全球区域势必引起一定的计算误差.文献[14]表明,在欧洲区域Bevis模型精度低于其他本地建立的模型.文献[15]检验Beivs模型在全球范围的精度,结果显示,Bevis模型计算的Tm值偏差在局部区域可达到10 K.由于Bevis模型在各地区精度的不均匀性,各国家和地区分别建立适合本地的模型,如荷兰区域模型[16]、加拿大和阿拉斯加区域模型[17]、巴西区域模型[18]、印度温带区域模型[19]、中国台湾区域模型[20]和中国香港区域模型[21-22]等.在中国大陆区域,学者们也建立了类似的局地模型,如北京地区模型[23]、成都地区模型[24]和武汉地区模型[25]等.文献[8]利用中国区域88个探空站14年的数据进行建模,得到中国区域统一模型与各单站的Tm-Ts线性模型,88个单站模型斜率范围跨度较大(0.35~0.96),显示了明显的地区性差异以及各局部地区建立小范围模型的必要性.

文献[8]对中国各区域的Tm-Ts线性模型精度进行了一定的研究,然而其分析是基于各模型的拟合精度,即建模精度(建模数据与所建模型之间的一致性程度),本质上属于内符合精度分析.近几年,欧洲中期天气预报中心(ECMWF)推出第五代再分析资料ERA5,由于采用最新的预报模型和数据同化技术,该套产品时空分辨率和数据质量较之前版本均有所提高[26-28].本文拟以ERA5数据为参考值,评估文献[8]中建立的各单站Tm-Ts线性模型精度,比较单站模型与中国区域统一模型的精度差别,并对线性模型Tm计算值与参考值间偏差特性进行分析.

图1 用于建模的88个探空站分布及所建的统一模型与单站模型

1 数据与方法

文中涉及的数据有中国区域无线电探空观测资料和ECMWF的ERA5再分析资料,前者用于建立Tm-Ts线性模型,后者用于模型精度分析.

1.1 中国区域性Tm-Ts线性模型的建立

基于探空数据建立Tm-Ts线性模型的工作已在文献[8]中完成,以下对该部分内容进行简要回顾.

对于每一条探空廓线,以地面测站高度处观测的气温(即探空廓线数据中的首个观测值或最低高度观测值)作为地表气温Ts,根据大气加权平均温度的定义式计算Tm,定义式的离散形式如下:

(1)

式中:Tm为大气加权平均温度;N表示将大气在垂向上划分的层数;i表示划分层中的第i层;Pwi表示第i层的平均水汽压;Ti表示第i层的平均气温;Δhi表示第i层的厚度.从式(1)可知,要计算大气加权平均温度需要知道各高度处的水汽压Pw,而探空数据文件中往往不直接提供水汽压数值,只提供水汽混合比mx和大气压P,因此需要根据以下公式计算水汽压Pw:

(2)

式中,mx的单位为kg/kg.

由多条探空廓线可以获取多对(Ts,Tm)i(i=1,2,…,n),从而可确定Tm与Ts的线性关系,即:

Tm=aTs+b.

(3)

理论上,只要n≥2,即可以确定式(3)中的系数a和b,而实际中,为了使获取的系数更可靠,往往采取较多数据点来拟合模型.本文采用分布于中国区域的88个探空站(图1a)2004—2018 年的数据建立两类Tm-Ts线性模型,一类是统一模型,即所有数据只建立一个线性模型(图1b 中红线),结果为

Tm=0.79Ts+50.72,

(4)

该统一模型由860 333条探空廓线数据得出,拟合精度为4.13 K.另一类为单站模型,即对每一个探空站分别建立Tm-Ts线性模型(图1b中灰线),各单站模型的系数(即式(3)中的系数a和b)如表1所示.

图1b显示,部分单站模型与统一模型存在明显差异,以单一的线性模型(统一模型)计算整个中国区域的Tm可能会带来明显的计算误差.

1.2 基于ERA5数据获取Ts和Tm

作为最新一代的ECMWF全球再分析资料,ERA5目前提供了近70年的历史气候数据.本文下载了中国区域2019年的逐小时气压层数据,气压从1 000 hPa 至 1 hPa,共37层,高度约80 km,数据的水平分辨率为0.25°×0.25° (约30 km),下载的变量包含重力势、比湿和气温.根据式(1)计算大气加权平均温度,各层的气温可从再分析资料中直接取出,而高度需要根据重力势计算,公式如下:

(5)

式(5)中:Φ为重力势;g为重力加速度,本文取9.806 65 m/s2.水汽压数值根据再分析资料中的比湿数据计算,比湿q与水汽混合比mx的关系为

(6)

将式(6)代入式(2),整理得到比湿q与水汽压Pw的关系为

(7)

式中的气压P可直接从再分析资料各气压层获取,q的单位为kg/kg.从再分析资料中直接或间接获取温度、高度和水汽压等数据后,即可采用式(1)计算Tm.

由探空数据建立Tm-Ts线性模型时,以测站高度处的气温为Ts,并且以此高度为起始高度,往上积分,获取Tm.测站高度与ERA5气压层高度并不一致,因此,在使用ERA5数据评估Tm-Ts线性模型时,首先需内插出各探空站高度处的数据.例如,若探空站高度为hs,介于ERA5数据中高度为h1和h2的两气压层之间(h1

(8)

类似地,hs高度处的比湿qs为

(9)

当hs比ERA5中的最低层的高度低,即hs

对于hs高度处的气压Ps,一般不采用线性形式的内插或外推,而采用以下公式计算:

用ZMD-2型电子密度计,采用排水法测量烧结试样的烧结密度;用Leica DM4000型显微镜,对烧结试样的横截面进行孔隙度测试;用DM400M型金相显微镜,对烧结试样进行显微组织分析;用HR-150A型洛氏硬度计,测量试样的硬度(HRB).

(10)

式中,Rd为干空气气体常数,文中取值为287.053 J/(K·kg).

通过以上内插或外推,获取hs高度处的气象参数(Ts,qs,Ps),以该层数据作为首层,采用式(1)对ERA5气压层数据向上积分,获取大气加权平均温度Tm.地表气温取hs高度处的气温.

气象参数的垂向内插或外推解决了探空站高度与ERA5数据层高度不一致的问题,然而,在平面上,探空站位置与ERA5格点位置并不重合,也需要一定的处理.一般认为,Tm-Ts线性关系在50 km范围内(保守估计)是一致的或变化很小,而由ERA5数据平面分辨率可知,各探空站与最近的ERA5数据格点距离不超过30 km,因此,可以直接采用与该探空站平面距离最近的格点数据评定该站的Tm-Ts线性模型精度,而不需要在平面上将数据内插至探空站位置.

2 结果与分析

以下基于ECMWF的ERA5数据,评估各单站Tm-Ts线性模型精度,比较模型的检验精度与建模精度,比较各站上使用单站模型和统一模型的精度,分析各模型计算的Tm与ERA5Tm间偏差特性.

2.1 模型检验精度与建模精度

对各测站按1.2节方法从ERA5数据中获取测站高度处的温度和对应的大气加权平均温度,分别记为Ts_ERA5和Tm_ERA5,假设测站处的Tm-Ts线性模型为Tm=aTs+b,则大气加权平均温度的模型计算值为

Tm_Calc=aTs_ERA5+b,

(11)

模型计算值Tm_Calc与参考值Tm_ERA5间的均方根误差RMSE(量值记为ηRMSE)为

(12)

分别计算各单站模型Tm计算值与参考值间的RMSE,即各模型的检验精度,结果如图2中红色的点所示,RMSE在1.8~5.5 K.模型检验精度反映ERA5数据与各模型的一致性程度.各单站模型的建模精度(数据来源于文献[8])如图2中蓝色的点所示,RMSE值在1.9~5.0 K.建模精度指原始建模数据与Tm-Ts线性模型值之间的RMSE,反映建模数据与所建模型的一致性程度.图2中(包括图3和图5)横坐标显示的探空站序号与具体探空站的对应关系见附表1.若整体分析,所有88个站模型检验精度与建模精度差值的平均值小于0.02 K,说明两种精度总体上是一致的,然而,若逐站分析,则可发现部分测站上模型检验精度与建模精度有显著差别,个别站上差别达1.5 K.在2.3节中将说明,造成这些测站上两种精度显著差别的一个主要原因是Tm模型计算值与参考值间存在明显系统性偏差.

图2 各单站模型建模精度(蓝)和模型检验精度(红)

2.2 单站模型与统一模型

对各站分别使用单站模型和统一模型计算Tm,并求得各模型计算值与参考值间的RMSE.对于文中的88个站,单站模型RMSE比统一模型RMSE平均小0.6 K.图3显示,在总体上单站模型精度优于统一模型,在65个站上,单站模型RMSE比统一模型RMSE小,然而两类模型间的精度差别因站而异,有些站上单站模型RMSE明显小于统一模型RMSE,如序号为10~20的测站,而有些站单站模型RMSE仅略小于统一模型RMSE,如序号为2和3的测站.另外23个站,单站模型RMSE略大于统一模型RMSE,这是因为这些站采用单站模型相对于采用统一模型,Tm计算值精度改进不明显,再加上检验数据本身带有误差,由此出现结果的不确定性.

图3 单站模型(黑)、统一模型(红)Tm计算值与参考值间偏差的均方根值

图3表明在部分站上单站模型相较于统一模型在精度上有明显的改进.为显示这些站的地理分布特征,将单站模型RMSE比统一模型RMSE低1 K及以上的测站用红色标识,其他测站用蓝色标识,如图4所示.红色站点主要分布于中国的西部、西北和内蒙区域,这说明,采用单站模型替代统一模型,在这些区域能显著提高Tm计算精度.

图4 单站模型RMSE比统一模型RMSE小1 K以上的测站(红色)以及其他测站(蓝色)

2.3 模型计算值与参考值间偏差分析

为研究由线性模型计算的Tm值(计算值)和由ERA5数据积分得到的Tm值(参考值)间偏差的特性,计算各站Tm计算值与参考值间偏差,求得各站平均偏差和扣除平均偏差后的RMSE.图5a显示,大部分站有明显的系统性偏差,偏差值范围为-1.22~4.54 K,除了6个站,其他站均呈现正的平均偏差,说明相对于参考值,由线性模型计算的Tm值总体上偏大.文中各站Tm-Ts线性模型由探空数据建立,而检验模型时采用ERA5数据,因此,Tm模型计算值与参考值间明显的系统性偏差揭示了探空与ERA5再分析资料间的不一致性.

各站Tm模型值与参考值间去均值偏差RMSE如图5b所示.对比图2可知,扣除偏差均值后,Tm模型计算值与参考值间的一致性明显增加,RMSE值在1.5~3.5 K.

考虑到季节可能影响Tm模型计算值与参考值间偏差,对所有测站进行分析,发现可将所有测站分为两类:一类是随着季节的变化,Tm模型计算值与参考值间偏差变化不明显,如图6a北京站数据所示(这类测站共39个);另一类是随着季节变化,偏差发生明显变化,如图6b海拉尔站数据所示(这类测站共49个),在年积日第150至第270天(6—9月)期间,Tm模型计算值与参考值间偏差相对较小,而其他月份偏差较大.以上现象说明,在像海拉尔这一类测站上,采用不随季节变化的Tm-Ts模型,在各个季节计算结果精度不一致,为提高总体精度,须将模型做相应的季节调整.

图5 Tm模型计算值与参考值间的平均偏差(a)和扣除平均偏差后的RMSE(b)

3 结束语

大气加权平均温度Tm是GNSS水汽计算中的一个关键参数,为提高中国区域Tm计算精度,文献[8]在88个探空站上建立各自的Tm-Ts线性模型,每个模型只用于测站及周边小范围区域,以保证模型的有效性.本文以ECMWF最新再分析资料ERA5数据为参考值,检验文献[8]中各单站模型精度,比较单站模型与中国区域统一模型以及分析模型计算值与参考值间的偏差,结果显示:

1)各站Tm模型计算值与参考值间RMSE为1.8~5.5 K,模型检验精度与模型建模精度基本相当;

2)多数站的Tm模型计算值与参考值间存在系统性偏差,且偏差值大多为正,扣除各站平均偏差后,模型计算值与参考值间RMSE降为 1.5~3.5 K;

图6 模型计算的Tm值(红)和ERA5数据积分计算的Tm值(蓝) a.北京站数据;b.海拉尔站数据

3)与使用中国区域统一的Tm-Ts模型相比,使用单站模型在中国西部、西北和内蒙区域能明显提升Tm计算精度;

4)在半数以上的测站上,Tm模型计算值与参考值的偏差随着季节不同有明显变化,对于这些测站,使用随季节变化系数的Tm-Ts线性模型将可能提高Tm计算精度.

以上结果可为实际应用提供参考或为进一步改进Tm-Ts线性模型精度提供方向.根据较多测站Tm模型计算值与参考值间存在系统性偏差这一现象,可以推测探空数据与ERA5数据间存在着系统偏差,然而,具体是哪一种资料带来偏差是未知的,需要进一步研究.

附表1 探空站位置及各单站Tm-Ts线性模型

猜你喜欢
参考值测站线性
WiFi室内定位测站布设优化的DOP数值分析
二阶整线性递归数列的性质及应用
萍乡市体检人群甲状腺功能正常参考值范围及甲状腺结节患病率的调查
线性回归方程的求解与应用
利用探空产品评估GNSS-PPP估计ZTD精度
美伊冲突中的GPS信号增强分析
非齐次线性微分方程的常数变易法
线性回归方程知识点剖析
妊娠中晚期血脂变化及参考区间的建立
大蒜洋葱治好高血脂