变动河床水文测验断面借用体系的适用性研究

2018-09-10 07:22赵淑饶王怀柏赵晶刘炜裴斌
人民黄河 2018年6期
关键词:适用性

赵淑饶 王怀柏 赵晶 刘炜 裴斌

摘要:为分析变动河床断面变化及其主要影响因素,快速获取河道断面过水面积,提高洪水过程流量测验的时效性,以黄河干流龙门、吴堡两站为研究对象,利用随机森林算法、水深代表垂线法等对洪水过程中的断面冲淤、形态变化与水位、流速及流速横向分布进行了回归分析,建立了洪水过程断面形态预测模型。以断面流速分布为参照,科学合理地预测过水断面水深及流速分布,快速计算实时流量,并构建了适用性较强的断面借用技术体系,有效提高了现代测验技术条件下流量测验的时效性。

关键词:适用性:水深代表垂线:断面借用体系:变动河床:水文测验

中图分类号:P333:TV882.1

文献标志码:A

doi: 10.3969/j.issn.1000-1379.2018.06.002

1 概述

黄河干流河龙区间(河口镇一龙门区间)河道窄深,其洪水表现为流速大、含沙量高、涨落急剧、历时短、洪峰流量大、漂浮物多,洪水时断面冲淤变化剧烈。在高洪测验过程中,受含沙量、流速、飘浮物等因素影响,测深仪器和设备的使用受到极大限制,往往无法施测过流断面,采用浮标或非接触测流仪测得表面水流流速后,需借用测验之前或之后的实测断面数据。由于洪水过程中断面冲淤变化大,因此借用断面会造成较大失真。据该河段有关测站历史资料分析,根据断面借用时机的不同,流量误差会超过30%[1]

本文以河龙区间两个重要控制站——吴堡和龙门水文站为研究对象,分析洪水过程中断面冲淤及流速变化规律,建立断面形态预测模型,研究流量计算中过水断面的获取方法,提高实时流量计算精度。

2 断面借用的理论依据

流速一面积法是最基本的流量测验方法之一,其基本原理是通过水深、流速沿横断面的分布来求算流量[2]计算公式为式中:Q为全断面流量;v为测点流速;A为过水面积;h为水深:B为水面宽。

实际应用中,将积分法变成有限差分的形式,即通过在断面上布设有限的测速测深垂线,将断面分割成有限个单元,采取单元流量求和的方式得到断面流量。对特定水文站断面,单次的流量Q为单元面积Ai和其上平均流速vi,乘积的总和,即

过水断面面积A和断面平均流速v为单次流量计算的基本要素。现代流速测验技术可以快速施测水面流速得到断面流速分布。借用断面的物理基础:后状态断面是由前期断面演变而来的,是水流、泥沙作用的结果,研究这些因素的影响规律,可以科学、合理地借用后状态断面,快速计算流量。

3 断面借用技术研究

3.1 基于随机森林算法的断面形态预测模型

3.1.1 随机森林算法

随机森林算法[3]是Bagging集成学习方法与随机子空间相结合的一种分类器组合方法,其基础是决策树算法,该算法主要分为训练样本子集和子分类两部分。其中:训练样本子集从原始训练集中通过随机抽样的方式获取,由多个子分类模型可得到多个分类结果,然后通过对每个子分类模型的预测值进行投票(预测对象为分类变量时)或取平均值(预测对象为连续数值变量时)来决定最终预测值。随机森林算法流程见图1。

3.1.2 断面形态预测模型

本文将测次断面流速分布作为初选预测因子(白变量),将对应测次起点距的垂线水深作为预测对象(因变量),输入Matlab逐步筛选程序,并设置F检验的显著性水平α= 0.1。以流速分布、水位、最大流速、起点距范围、最大水深等为參数,采用随机森林算法逐步筛选预测因子,建立断面形态预测模型,预测各个起点距对应的水深,进而得到断面形态。

3.1.3 模型参数优选

考虑研究成果的实际应用,断面形态预测模型分为两种类型:一种不含实测水深,称为119模型,模型参数为水位、起点距、垂线平均流速(分布);一种包含实测水深,称为127模型,模型参数为水位、起点距、垂线平均流速(分布)、特征水深[最大、平均或者固定起点距水深(组合)]。两种模型预测精度评估[4]对比见表1。

由表1可知,实测水深是断面形态预测模型的一个显著影响因子。三个断面的分析结果表明,增加实测水深后,预测结果的决定系数均增大,均方差均减小。

根据两模型预测的水深分别计算对应断面面积和流量,并与实测结果进行对比,见表2、表3(E80误差为误差从小到大排列,累计80%时对应的误差绝对值)。可以看出,增加水深参数对随机森林模型的预测结果有良性改善,且效果明显。

3.2 水深代表垂线法预测断面平均水深

3.2.1 算法原理

河流过水断面面积测验是由一定数目的测深垂线测得的部分面积组成的。对每个测次而言,面积是水面宽B和相应平均水深H的乘积,即A= BH。

水面宽为水位Z的函数,一般可表示为抛物线形式。对于特定断面,该函数已知且基本保持不变。平均水深则较为复杂,对多沙河流而言,其与初始状态和水位、流速、含沙量等有关,且时刻处于变化中。就单个测次而言,平均水深可以推算出来,且一定有某一位置(或几个位置)的水深与断面平均水深日在数值上接近或相当,此种垂线称为代表垂线,其水深称为代表水深(h')。

通过对固定断面的大量样本进行统计分析,可以得到代表垂线水深与平均水深的回归函数关系,进而可以优选出一条或数条代表垂线的位置区域(以垂线数量少、代表性高为佳),在常规测量时只需实测这些代表垂线的水深,就可利用回归公式计算目标值,即H=f(h')。

其断面面积可表示为

A=BH= f1(Z)f2(h')式中f1(Z)为某个断面某一测次对应的已知水位或易获取的水面宽具体数值。

3.2.2 代表垂线优选分析

以研究目标站(龙门、吴堡)高于历史最高的某一水位作为标准水位,其对应河宽作为最大河宽。从断面左岸至有岸,按某一步长对全部测次实测断面起点距进行最小分割和相应垂线水深插补,作为基本数据源。

以垂线位置(或位置组合)为基准,对每个测次对应位置(或位置组合)垂线实测水深和对应测次平均水深进行回归分析。单垂线回归模型为双垂线回归模型为式中:h为预测平均水深;h1、h2为两条代表垂线的水深:α、b分别为两条垂线的改正系数;c为常数。

经分析,吴堡站河床为变动河床,断面形态呈V形,不同洪水(或不同时期)左右水边线沿河宽变幅较大。水深代表垂线法的回归分析中,单纯用两条垂线进行二元回归分析,结果不很理想。考虑水位、左/右起点距随洪水量级的变化,增加了水位及左右水边距等多个影响因子进行多元回归分析,得到吴堡站的双垂线回归模型为

h=αlhl+ α2 h2+α3z+α4 b左+α5 b右+c式中:α1,α2,…,α5为系数;z为水位;b左、b右分别为左、有岸起点距;c为常数。

点绘每条垂线(或双线组合)预测结果与实测平均水深的相关关系,分别计算决定系数(R2)和均方差(MSE),以决定系数作为评价指标进行优选和评估,确定最佳垂线起点距位置和最佳代表垂线组合方案。结果见表4。

由表4可以看出,双垂线回归模型的效果比单垂线回归模型的好。两种模型除了最佳位置外,在代表性较好的前提下,优选结果可以在一定范围内的起点距内选择,具体操作中可以不完全受最佳代表垂线位置的限制,同时也可有较好的测验精度。因此,以决定系数的大小作为判定标准,确定各断面起点距的优选范围,结果见表5。

4 断面借用体系的适用性

4.1 随机森林法断面形态预测模型的适用性

(1)随机森林法断面形态预测模型适用于水深和流速沿河宽分布具有对称性的断面形态,即二者沿河宽分布呈“蚌壳”形态(类似吴堡站),可以在多种测验条件下提供断面形态回归预测结果。

(2)对于龙门站河道断面,洪水过程中流速、水深沿河宽的分布虽有一定的对称性,但形态稳定性较差。次洪过程中最大水深与最大流速往往沿河宽左右滚动且不对应。运用该方法进行断面形态回归预测时需特别考虑特征水深的影响。

表6为龙门站两断面两种模型的分析结果对比,其中“127模型”所用水深因子为两断面双垂线最优位置的代表水深,可以看出双垂线最优位置的代表水深对预测结果有极大的良性改善作用。因此,在同类型河道断面形态预测中应重点考虑垂线最优位置的代表水深。

(3)使用随机森林法断面形态预测模型时,资料的选取需遵循以下原则:资料属于同一个断面,资料系列长、代表性好(洪水量级、含沙量、多种断面形态变化实测资料等),训练集和检验集按一定比例(3:1)随机分配。

(4)“127模型”优于“119模型”,为有限个实测断面的统计学分析结果。不同断面的预测精度不同,对于某一测次的预测成果,“119模型”也存在精度高于“127模型”的可能性,生产中可根据实际分析结果酌情选用。

(5)使用随机森林法断面形态预测模型时需按照约定格式对断面资料进行标准化处理并选用适当的模型参数。

4.2 水深代表垂线法的适用性基础

(1)任何一个测验断面均存在一条或多条与断面平均水深有较好等效关系的垂线,可将其作为代表垂线(或垂线组合)施测水深。

(2)对于龙门站U形河道断面形态,水深代表垂线法的各级水位左右水边线基本固定(或变动较小),单、双垂线水深回归模型结果均比较稳定,建模方法可用于其他同类断面的水深代表垂线回归分析中。

(3)對于吴堡站V形断面形态,变动河床的测验河道断面,不同洪水(或不同时期)左右水边线沿河宽变幅较大。在水深代表垂线法的回归分析中,需考虑流量级及左右水边线(即加入水位、左/有起点距)等影响因子进行多元回归分析。

(4)该方法可在多种测验条件下为任何测站提供断面面积回归预测结果。但是,需要进行具体断面的回归分析和优选,包括代表垂线数目的确定。

5 结语

(1)随机森林算法为机器学习算法,断面形态预测模型的建立基于对长系列历史资料的回归分析。实际应用中,应通过足够多的断面资料进行模型训练和结果检验,拟合度满足规范要求后才可使用。

(2)对于游荡型河道,需根据河道断面位置对资料进行归类整理后才能应用到断面形态预测模型当中。训练集要尽可能满足时序长、代表性强等要求。

(3)双垂线水深回归模型水深的预测结果明显优于单垂线水深回归模型的。从水深施测选择范围来看,双垂线水深的两条垂线基本位于断面水边部位,更利于实际操作。

(4)增加垂线数量理论上可以提高测量结果的准确度,但从实际流量测验精度评估和时效性需求(快速、安全、保障一定精度)来看.双垂线回归模型的结果已基本接近实测值。继续增加垂线数造成的决定系数和均方差变幅极小,对回归结果影响微小,而且会因测时延长而影响流量信息的时效性。

(5)分析方法中充分考虑了断面不同影响因素,并做到结果最优化,成果不仅适用于各类水文站洪水测验的断面获取,而且能够有效应用于日常测报T作对监测位置选取(固定点水面流速监测)、新型流速监测仪器应用对断面资料的需求以及水文监测技术的优化分析等方面,为多沙河流实现流量测验自动化、快速化提供了技术支撑。

参考文献:

[1] 李文平,慕明清,陈三俊.多沙河流洪水期断面借用方法探讨[C]∥中国水力发电工程学会水文泥沙专业委员会第七届学术讨论会论文集(下册).大连:中国水力发电工程学会,2008:37-41.

[2]谢悦波.水信息技术[M].北京:中国水利水电出版社,2009:68.

[3] BREIMAN L Random Forests[Jl. Machine Learning, 2001, 45(1):5-32.

[4] 黄振平,陈元芳.水文统计学[M].北京:中国水利水电出版社,2011:101-128.

猜你喜欢
适用性
基于混相模型的明渠高含沙流动底部边界条件适用性比较
4种中药制剂微生物限度检查方法的适用性试验
CLDAS土壤湿度产品适用性评估
磨刀不误砍柴工,谈方法的适用性
交互式电子技术手册结构化数据适用性研究
交互式电子技术手册结构化数据适用性研究
磨刀不误砍柴工,谈方法的适用性
某门头桁架YJK和Midas整体分析及简化设计法的适用性探讨
如何提高学具在数学教学中的适用性
追求小组合作“三性”提升数学教学质效