长江中下游湖泊群不同生活型水生植物分布的时空变化(1986-2020年)*

2023-11-06 08:01刘兆敏张玉超关保华杨启铎
湖泊科学 2023年6期
关键词:生活型沉水植物湖泊

刘兆敏,张玉超,关保华,曹 振,来 莱,杨启铎

(1:中国科学院南京地理与湖泊研究所湖泊与环境国家重点实验室,南京 210008)(2:中国科学院大学,北京 100049)

水生植物是湖泊生态系统中重要的初级生产者,具有净化水质、减少污染、促进沉降、抑制藻类、固碳释氧等生态功能,在维持湖泊水质和湖泊生物多样性中发挥着重要作用[1-4]。根据生活型的不同,水生植物可分为挺水植物、浮叶植物(含漂浮植物)和沉水植物[5]。由于不同生活型水生植物具有各自特定的生活环境[5],其去氮能力[6]、净水能力[7]、碳固持能力[8]和对藻类的抑制作用存在显著类群间差异[9]。因此,准确掌握水生生态系统中不同生活型水生植物的时空分布,对确保水生生态系统稳定,科学认识内陆水体碳源/碳汇特征及其增汇潜力具有重要意义[10]。

传统水生植物监测主要依靠实地观测、步量、目测和样本估算[11-12],调查区域有限,且过程耗时长,易受环境影响[13-14],不利于水生植物的大范围、长时序监测[15-16]。遥感技术具有时效性强、监测范围广、成本低、数据综合可比等优势,不仅可以快速获取大范围水生植物地面信息,还可以追溯长时序水生植物历史空间分布[17-18]。因此,遥感技术与野外样方监测相结合已成为准确获取大区域、长时序水生植物时空变化的重要方法之一。目前,国内外学者基于水生植物光谱特征,通过构建不同光谱指数[19-22],研发出多种水生植物遥感识别方法和模型,如非监督分类[23-24]、监督分类[25-27]、决策树分类[28-29]等,其中决策树分类法是近年来主流的水生植物遥感分类方法[30-33]。一方面,现有的遥感识别方法难以准确区分藻华及水生植物[34]。另一方面,随着类别和特征变量个数的增加,决策规则建立的难度增大,阈值难以可靠确定,严重阻碍决策树分类的自动化、智能化水平,降低了水生植物的识别效率[35-36]。目前,机器学习算法以其更高的自动化程度和计算效率有效弥补了传统参数化算法的不足,已成功用于水生植物遥感监测中[35,37]。

长江中下游有广泛的水生植物适生分布区[38],但该区域人口密集、社会经济发达,受人类活动的剧烈影响,该区域湖泊富营养化趋势显著[39],导致水生植被衰退,植物群落逆行演替[40-41]。目前该区域的不同生活型水生植物分布相关研究主要集中在个别湖泊如太湖、鄱阳湖等[42-44],缺乏全流域、长时序时空分布的系统研究。Zhang等[45]基于文献调查方法评估了1900-2015年全球水生植物变化趋势,其中仅涉及该流域的25个湖泊;王双双[46]基于Landsat卫星数据开展了1980-2017年中国湖泊水生植物覆盖度遥感监测,仅涵盖了该流域的20个湖泊,且未开展水生植物的分类监测;Luo等[33]基于Landsat卫星数据量化了1985-2021年长江中下游湖泊浮叶/挺水植物和沉水植物的时间变化,但研究区仅为该流域内的26个大型湖泊(>50 km2)。

因此,本文以长江中下游10 km2以上的湖泊(131个)为研究区域,基于野外观测、数理统计方法,通过厘清不同生活型水生植物的光谱特征,研发不同生活型水生植物遥感高精度机器学习识别算法,解析1986年以来长江中下游不同生活型水生植物的时空变化规律。

1 研究区与数据

1.1 研究区概况

长江中下游流域是我国水资源最为丰富的区域,著名的五大淡水湖中的4个:太湖、巢湖、洞庭湖、鄱阳湖,均位于此区域。该流域属亚热带季风气候,年平均气温15~20℃,年平均降水量大于1000 mm,水热条件优越[47]。该流域内共有131个面积大于10 km2的淡水湖泊[48],分布在长江干流流域、鄱阳湖流域、洞庭湖流域、太湖流域、汉江流域5个次级流域内。研究区湖泊总面积为15889.98 km2,其中长江干流流域、鄱阳湖流域、洞庭湖流域、太湖流域、汉江流域内湖泊数量分别为71、14、23、14、9个,湖泊面积分别为5731.29、3726.50、2930.78、3177.04和324.38 km2。

1.2 水生植物野外调查数据

2016年与2019年对长江中下游31个湖泊开展了2次水生植物野外样点实地调查(图1),共采集90个监测点位水生植物生长数据,其中2016年监测点76个,2019年监测点14个;此外,2020-2021年对太湖开展了6次水生植物调查,覆盖春夏秋冬不同季节(附表I)。考虑到Landsat卫星影像的空间分辨率(30 m),为使采集样本最能代表所在像元尺度水生植物特征,选择在30 m×30 m的水生植物样区中心位置采样,调查内容包括植物类型、覆盖度等,并使用手持GPS接收机记录采样点的经纬度坐标。

图1 研究湖泊地理位置Fig.1 Geographical location of studied lakes

1.3 卫星数据

1)Sentinel-2 MSI遥感影像数据。采用Sentinel-2 MSI大气校正数据产品生产2020-2021年太湖不同生活型水生植物真值数据集。Sentinel-2可覆盖13个光谱波段,包含4个10 m、6个20 m和3个60 m空间分辨率的波段,将20 m和60 m空间分辨率波段重采样至10 m。本文选取了8景无云或少云遥感影像,成像时间接近野外调查时间,具体时间分别为:2020年3月19日、2020年5月13日、2020年8月1日、2020年10月5日、2021年3月24日、2021年5月30日、2021年8月26日和2021年10月5日。

2)Landsat系列遥感影像数据。Landsat系列卫星可以提供近40年的遥感数据,本研究主要用于重现长江中下游湖泊水生植物分布长期变化[49-50]。本文以Google Earth Engine(GEE)平台上Landsat系列卫星地表反射率影像为主要数据源,共选取1986年、1990年、1995年、2000年、2005年、2010年、2015年、2020年8个年份合计537景遥感影像。该数据集中2010年(含)以前的影像来自Landsat 5地表反射率数据集,已使用LEDAPS算法进行了大气校正,2015年和2020年的影像来自Landsat 8地表反射率数据集,已使用LaSRC算法进行了大气校正[51]。

2 不同生活型水生植物遥感监测算法

本研究技术路线如附图Ⅰ所示:首先基于GEE云平台生产1986年以来长江中下游湖泊群Landsat合成数据集Ⅰ,选取数据集Ⅰ中2020-2021年的太湖影像为数据集Ⅱ、2016和2019年长江中下游影像为数据集Ⅲ。算法构建中数据集Ⅱ的光谱反射率及光谱指数作为自变量,Sentinel-2 MSI大气校正数据产品生产的2020-2021年太湖不同生活型水生植物真值数据集作为因变量,共同构成机器学习样本集。其中,70%作为训练样本集,30%作为验证样本集,对模型进行精度评价及参数调优得到不同生活型水生植物遥感监测算法。此外,本文还基于数据集III及2016、2019年长江中下游野外实测数据对该算法进一步验证。最后,将模型应用到数据集I得到长江中下游1986年以来不同生活型水生植物时空分布结果。

2.1 Landsat数据集生产

基于GEE云平台对1986年以来Landsat 5/8地表反射率产品进行去云处理,利用质量控制波段(pixel_qa)去除卷云云层和积雪。考虑到水体范围具有高度可变性,本研究先利用最大水体边界裁剪去云后的影像得到影像集I[48],然后使用多指数水体提取算法[52-53]逐年提取长江中下游流域的水体得到新的掩膜,用该掩膜对影像集I分别再裁剪得到影像集Ⅱ。已有研究表明[52]基于时序影像的数据合成技术可以有效去除影像上的噪声,因此选取影像集Ⅱ中当年水生植物生长茂盛的夏季(7-9月)影像合成一幅覆盖长江中下游湖泊群的无云遥感影像。

2.2 不同生活型水生植物空间分布真值数据集生产

基于太湖2020-2021年3月、5月、8月和10月水生植物实地调查及同期Sentinel-2 MSI大气校正数据产品,将地理位置、影像色调、斑块大小、形状、归一化植被指数(normalized difference vegetation index,NDVI)等作为判别标志,生成水体、藻华、沉水植物、挺水植物、浮叶植物训练样本。然后使用极大似然法分类获取8景10 m分辨率的太湖不同生活型水生植物分类结果,利用实测样点对分类结果作精度评价,总体精度在82%~88%之间,该8景高精度不同生活型水生植物分类结果将作为算法的真值数据集。

2.3 机器学习算法构建

1)特征选取。本研究基于机器学习算法识别不同生活型水生植物。选取Landsat卫星数据的3个可见光波段、1个近红外波段、2个短波红外波段和3个光谱指数作为水生植物的识别特征[34](表1)。

表1 遥感影像光谱指数Tab.1 Spectral index of remote sensing imagery

如图2所示,由于纯水在近红外、短波红外波段的强烈吸收,其反射率在近红外波段迅速下降[54]。浮游植物中叶绿素a在绿光波段弱吸收,藻蓝素在红光波段存在强吸收[55]。浮游植物水华的光谱类似于植被,在近红外波段有较高的反射率,但在短波红外波段反射率下降显著。浮叶/挺水植物在可见光部分反射率偏低,在近红外波段有明显的抬升,在短波红外处由于体内细胞多次反射,仍处于“近红外高台”,反射率偏高[56]。为了进一步提升上述地物的区分度,本研究增加CMI、FAI和TWI遥感指数作为输入参数。图2表明,CMI可以有效区分藻华和水生植物:CMI藻华>CMI水生植物,FAI能识别普通水体和含有藻华/水生植物的水体,TWI主要用于剔除高悬浮物水体[34]。

图2 不同水域水生植物光谱特征曲线(基于样本数据集的不同地物在特征波段和光谱指数上的反射率概率分布)Fig.2 Spectral characteristic curves of aquatic vegetation in different waters (Probability distribution of reflectance of different ground features in characteristic bands and spectral indices based on sample dataset)

2)样本集构建。筛选Landsat数据集中2020-2021年太湖影像并增加3个光谱指数作为特征变量,太湖不同生活型水生植物真值数据集作为类别标签,逐像元提取特征变量与类别标签得到百万条水生植物样本。同时为了避免监督分类误差造成的误差传递,利用标准差方法对水生植物样本进行数据清洗。比较1~3倍标准差的异常值处理效果,水体样本使用3倍标准差,藻华和水生植物样本使用更严格的1.5倍标准差剔除异常值后训练出的模型效果最好。最后利用随机欠采样的方法均衡各类别样本数量,得到水体、藻华、沉水植物、挺水植物、浮叶植物的样本数量分别为500000、500000、167761、62305、78360。

3)随机森林算法。随机森林(random forest, RF)算法是一种以决策树为基本单元的集成算法,可以允许来自多源的高维复杂数据共同作用[57,58]。对于随机森林来说,树的分叉越多,深度越深,模型越复杂,运算效率也会降低。本研究使用网格搜索交叉验证方法(grid search cross validation)对决策树个数(n_estimators)进行参数调优,实验发现当n_estimators设置为110时模型的误差逐渐收敛且准确率最高。

4)深度神经网络算法。深度神经网络(deep neural networks, DNN)是深度学习中较为典型的算法结构,其内部的神经网络层可以分为3层:输入层、隐藏层和输出层[59]。本研究构建的4层全连接神经网络包含2个隐藏层,设置9个输入节点,5个输出节点。模型训练通过交叉熵损失函数(cross entropy loss)求取损失,以Adam算法作为优化器,使用余弦退火(cosine annealing)以及Warm Restart规划学习率。

2.4 精度评价方法

将水生植物遥感分类结果与实测样本点进行混淆矩阵精度评价,评价指标包括生产者精度(producer accuracy,PA)、用户精度(user accuracy,UA)、总体精度(overall accuracy,OA)和Kappa系数。

PA=aii/a+i

(1)

UA=aii/ai+

(2)

(3)

(4)

式中,aii为某一类别i被正确分类的数量,a+i为实际观测的i类别的数量,ai+为分类结果中i类别的数量,N为样本总数,n为设置的类别数量。

3 结果与讨论

3.1 长江中下游湖泊群水生植物遥感监测精度评价

基于实测的水生植物调查数据,应用混淆矩阵方法对两种机器学习算法的精度进行评价,如表2所示。基于RF算法的不同生活型水生植物的遥感监测结果总体精度为0.81,Kappa系数为0.74,其中水体、沉水植物、挺水植物、浮叶植物的生产者精度分别为0.94、0.75、0.88、0.72,用户精度分别为0.65、0.93、0.74、0.93。基于DNN算法的分类结果总体精度为0.79,Kappa系数为0.72,其中水体、沉水植物、挺水植物、浮叶植物的生产者精度分别为0.85、0.75、0.90、0.70,用户精度分别为0.62、0.92、0.71、0.93。结果表明,RF算法的分类效果相对较好,因此本文选用RF算法的分类结果,开展对湖泊水生植物空间分布和变化趋势的分析。

表2 不同生活型水生植物机器学习识别结果精度定量评价Tab.2 Quantitative evaluation of machine learning recognition accuracy of different life-form aquatic vegetation

RF算法的分类结果的混淆矩阵(表3)显示,部分沉水植物被误判为水体,原因是沉水植物光谱是植物和水体的混合光谱,只有当实地调查点上沉水植物达到一定密度时才能引起较强的光谱响应[54];同时对样本数据清洗时采用了更严格的参数去除水生植物样本异常值,以防止水生植物识别面积偏大。部分浮叶植物会被误判为挺水植物,一方面是因为高密度的浮叶植物光谱与挺水植物非常接近,另一方面部分浮叶植物群落和挺水植物群落混杂生长,容易造成错分[60]。

表3 RF算法的水生植物分类结果混淆矩阵Tab.3 Confusion matrix of aquatic vegetation classification results based on RF method

3.2 长江中下游湖泊群不同生活型水生植物空间分布

基于不同生活型水生植物遥感监测算法,本研究生成了1986-2020年长江中下游湖泊群水生植物分类结果。通过统计不同生活型水生植物的像元数量,结合Landsat数据空间分辨率(30 m)进而获得不同生活型水生植物面积。结果显示,1995年水生植物面积最大(记为“Max1995年”,下同),为4571.42 km2,2010年面积最小(记为“Min2000年”,下同),为2541.58 km2,最大面积占湖泊总面积的28.77%。该流域湖泊水生植物的优势类型是沉水植物(Max1995年=2649.21 km2,Min2005年=921.38 km2),最大面积占湖泊总面积的16.67%;其次是挺水植物(Max2005年=1779.44 km2,Min2020年=569.05 km2),最大面积占湖泊总面积的11.20%;浮叶植物(Max2015年=685.68 km2,Min2000年=293.04 km2)面积占比最小,其最大面积仅占湖泊总面积的4.32%(图3)。长江干流流域湖泊水生植物分布面积最大(Max1995年=2104.03 km2,Min1986年=1223.08 km2),其后依次是鄱阳湖流域(Max2000年=1065.78 km2,Min2010年=122.91 km2)、洞庭湖流域(Max1995年=647.10 km2,Min2000年=216.73 km2)、太湖流域(Max1995年=616.71 km2,Min2020年=258.96 km2)和汉江流域(Max1995年=191.43 km2,Min1986年=32.52 km2)。图4表明,长江干流流域、鄱阳湖流域和汉江流域湖泊以沉水植物为优势类型,洞庭湖流域和太湖流域湖泊以挺水/浮叶植物为优势类型。

图3 长江中下游湖泊群1986-2020年夏季水生植物面积统计(仅展示面积最大的前5个湖泊)Fig.3 Statistics on the area of lacustrine aquatic vegetation in the middle and lower reaches of the Yangtze from 1986 to 2020 in summer (Only the top 5 aquatic vegetation area are displayed)

图4 长江中下游子流域1986-2020年夏季湖泊水生植物面积统计Fig.4 Statistics on the area of lacustrine aquatic vegetation in sub-basins of the middle and lower reaches of the Yangtze from 1986 to 2020 in summer

3.3 长江中下游湖泊群不同生活型水生植物面积变化趋势

1986-2020年长江中下游湖泊群水生植物面积整体呈现先增后减再增的趋势(图5):1986-1995年呈增加趋势;1995-2010年呈减少趋势,从4571.42 km2减少至2541.58 km2,降幅为44.40%;2010-2020年湖泊水生植物总面积略有上升(21.16%)。长江中下游湖泊群水生植物面积变化主要由沉水植物主导,沉水植物面积变化趋势与总面积变化趋势基本一致(r=0.80,P<0.01),挺水植物面积呈先增后减趋势,浮叶植物面积变化不大。

图5 不同生活型水生植物面积变化(间隔4~5年)Fig.5 Changes in the area of different life-form aquatic vegetation (interval 4 or 5 years)

本文依据不同生活型水生植物面积变化率的±0.05 km2/a作为阈值,将长江中下游湖泊的水生植物变化趋势分为“增加”、“不变”或“减少”[45],对不同变化趋势的湖泊数量进行统计(图6)。结果表明,1986-2020年有49个(37.40%)湖泊水生植物面积增加,47个(35.88%)减少,35个(26.71%)无变化。其中,沉水植物面积增加的湖泊数量(51个)多于减少的湖泊数量(35个),而挺水植物面积减少的湖泊数量(55个)是增加湖泊数量(14个)的3.93倍。将长江中下游湖泊按面积分为大型湖泊(>50 km2)、中型湖泊(20~50 km2)、小型湖泊(<20 km2),水生植物面积增加主要集中在中、小型湖泊,增加类型主要是沉水植物。55.26% 的大型湖泊的水生植物面积呈现减少趋势,减少类型为沉水植物和挺水植物。水生植物面积变化与湖泊规模间的规律与Zhang等的结果一致[45]。不同湖泊水生植物面积变化率如图7所示,水生植物面积增加的湖泊平均年增长率为0.28 km2/a,其中南漪湖的增加率最大(2.15 km2/a);水生植物面积减少的湖泊平均年减少率为-0.74 km2/a,其中梁子湖的减少率最大(-6.64 km2/a)。

图7 1986-2020年长江中下游湖泊群不同生活型水生植物面积的变化率((a)水生植物、(b)沉水植物、(c)挺水植物、(d)浮叶植物)Fig.7 Variation rates of different life-form lacustrine aquatic vegetation in the middle and lower reaches of the Yangtze from 1986 to 2020 ((a) aquatic vegetation, (b) submerged vegetation, (c) emergent vegetation, (d) floating-leaved vegetation)

5个子流域湖泊水生植物面积年际变化(图5)结果显示,太湖流域和长江干流流域湖泊水生植物面积呈先增后减趋势,在1995年到达峰值,沉水植物和挺水植物面积交替增加。鄱阳湖流域湖泊水生植物面积表现出双谷的特征,1990年和2010年水生植物面积迅速衰减,2010年水生植物面积最小。洞庭湖流域湖泊水生植物表现出双峰的特征,1995和2010年到达峰值,2000年水生植物面积最小。汉江流域湖泊数量最少,2000-2015十年间湖泊水生植物面积均小于50 km2,占流域湖泊面积小于15.41%。由变化折线图可以看出,长江干流流域湖泊水生植物面积最大,长江中下游流域湖泊水生植物面积变化由长江干流流域主导,其中湖泊水生植物面积变化幅度最大的子流域是鄱阳湖流域。

3.4 太湖及鄱阳湖不同生活型湖泊水生植物面积长时序变化趋势

本研究选取太湖、鄱阳湖为典型湖泊,统计其1986-2020年间水生植物面积变化(图8)。结果显示,鄱阳湖水生植物多年平均面积为593.18 km2,其中沉水植物、挺水植物和浮叶植物面积分别为386.15、174.38、34.65 km2。鄱阳湖水生植物2020年比1986年总面积略有下降,但多年来水生植物面积变化剧烈,最大达到了774.94 km2(2000年),最小只有52.82 km2(2010年)。2010年鄱阳湖星子站6月21日-8月15日平均水位为17.72 m,为2000年以来历史同期的最高值(2000-2009年水位:(14.50±1.09)m),水位高低、变动范围及频率是影响鄱阳湖水生植物面积变化的核心因子[61-62]。与鄱阳湖相比,太湖水生植物面积(118.49~268.98 km2)呈先增后减趋势,多年平均水生植物面积为161.15 km2,其中沉水植物、挺水植物和浮叶植物面积分别为42.51、82.75、35.90 km2,主要分布在东太湖、胥口等区域。湖泊水位、调水工程、水产养殖、水草收割等是太湖水生植物面积变化的主导因素[63]。

4 结论

本文基于Landsat系列影像,利用机器学习方法提取了1986-2020年长江中下游10 km2以上的湖泊不同生活型水生植物,水生植物遥感监测精度为0.81,Kappa系数为0.74。结果表明:长江中下游湖泊群水生植物面积为2541.58~4571.42 km2,占湖泊总面积的15.99%~28.77%,沉水植物是优势类型;该流域1986-1995年水生植物面积呈增加趋势,1995-2010年水生植物面积减少,2010年后水生植物面积再次增加。水生植物面积增加主要集中在中、小型湖泊,面积减少则主要在大型湖泊。空间分布上,长江干流流域湖泊水生植物分布面积最大,其后依次是鄱阳湖流域、洞庭湖流域、太湖流域和汉江流域。典型湖泊鄱阳湖水生植物面积变化剧烈,太湖以2000年为分界水生植物面积呈先增后减趋势。今后应进一步探索影响水生植物面积、空间分布、结构、组成的环境驱动力,科学管理水生植物,以维护水生生态系统的长期稳定。

致谢:向中国科学院南京地理与湖泊研究所陈非洲研究员、黄晓龙博士对本文撰写提供的帮助表示由衷的谢意。

5 附录

附表Ⅰ和附图Ⅰ见电子版(DOI:10.18307/2023.0631)。

猜你喜欢
生活型沉水植物湖泊
沉水植物生长影响因子研究进展
你相信吗?湖泊也可以“生死轮回”
沉水植物种植工程实施后物种多样性的变化
——以武汉紫阳湖为例
“害羞”的湖泊
论数学教学中有效运用数学模型
云中山南岭栲群落的生活型与叶特征研究
宽阔水国家级自然保护区珙桐群落特征及演替趋势分析
奇异的湖泊
沉水植物在修复富营养湖体的研究进展
关于初中数学作业布置的几点思考