基于MaxEnt 模型伊洛河流域油松潜在适生分布区模拟分析

2023-01-31 03:00李慧张志华荐圣淇
浙江林业科技 2023年1期
关键词:环境变量适生区油松

李慧,张志华,荐圣淇

(1.开封市水务开发建设有限公司,河南 开封 475000;2.郑州大学 黄河实验室,河南 郑州 450001)

油松Pinus tabuliformis是我国主要的用材树种之一,种植范围广泛,对于水土保持起着重要的作用。构建油松环境空间分布和栖息地适应性模型对于人工植被恢复和油松生态保护具有重要参考价值。张雷等[1]采用8个生态位模型分析了油松当前和未来气候条件下3 个时间段的潜在分布,但建模数据中仅包含7 个气候变量,缺乏重要的地形数据。肖敏等[2]选取全国气象站点插值的10 个气候环境因子,利用最大熵(MaxEnt)模型模拟我国油松分布区,结果表明我国油松中高度适生区域主要是我国华北、西北和东北等地[3-6]。

物种分布模型是生态学研究中最重要的工具之一,通常用于研究入侵害虫和植物物种的潜在威胁[7]。这些模型也是预测气候变化对物种分布影响的主要工具[8]。虽然已经建立了各种生态模型来预测分布,相关研究发现,在预测精度方面,MaxEnt 模型较其他模型具有明显的优势,可以有效解决不完整的物种分布情况[9]。MaxEnt 模型已被广泛应用于濒危物种适生区预测、特定物种气候环境适生性预测和物种保护优先级评估[10-13]。

本研究以伊洛河流域为研究区,以油松为研究对象,建立MaxEnt 模型,模拟伊洛河流域油松潜在空间分布格局划分油松适生区等级,确定影响伊洛河流域油松分布的环境主导因子,为油松在伊洛河流域的引种与栽培提供科学依据。

1 材料与方法

1.1 研究区概况

伊洛河流域是黄河中下游河段右岸重要支流,位于陕西地区东南部及河南省西北部 地理坐标为109°43~ 113°10' E,33°39'~ 34°54' N,见图1。伊洛河流域地处暖温带大陆性季风气候区,多年平均气温为13 ℃,降水集中在6—9 月,年均降水量为710~ 930 mm,年径流量为13.99 亿m3。伊洛河流域位于秦岭构造体系东段与新华夏系的复合部位,主要分布有花岗岩、玄武岩、第四系黄土、淤泥质砂壤土等;地势由西南向东北降低,分别为山地、丘陵和平原过渡带,地带性植被为暖温带落叶阔叶林。

图1 伊洛河流域油松分布样点位置Fig.1 Sampling sites in distribution area of P.tabuliformis in the Yiluo River Basin

1.2 数据来源

1.2.1 油松居群地理数据 油松地理分布信息数据由河南省林业局调查档案和野外观测获取,通过去除无效和重复数据,共收集到油松分布样本点109个(图1)。当收集区域比较密集产生空间聚类时,往往导致模型过度拟合,模型性能值下降。本文通过ArcGIS 10.5 以点距离大于5 km 的标准对采样点进行重采样,删除具有高度空间自动相关记录的原始分布数据,并在采样过程中尽量保留采样点,最终获取76 个有效分布点。

1.2.2 环境变量 从世界气候数据库(https://www.worldclim.org/)[14]中获取气候变量,该生物气象数据集由1970—2000 年世界气候2.1 版气候数据插值而成;海拔(Altitude)、坡度(Slope)、坡向(Aspect)3 个地形变量通过30 m×30 m 分辨率的DEM 提取;土壤变量从1∶100 万中华人民共和国土壤图中获取(表1)。

表1 相关环境变量名称及描述Tab.1 Description of environmental variables

为避免模型过度拟合,利用Spearman 和Pearson 相关检验对油松的19 个生物气象数据进行相关性分析。利用油松点随机抽取的76 个交叉相关矩阵,估算出19 个气候变量子集中的协方差。在此基础上,去除相关系数大于0.70 的环境变量,以便于对环境信息及其与生境的关系进行合理地解释。另外,利用MaxEnt v3.4.1 的刀切法(Jackknife)直接判断油松预测变量的重要性。最终筛选出10 个环境变量(表2)。

表2 筛选后的环境变量名称及描述Tab.2 Description of environmental variables after screening

1.3 MaxEnt 模型构建与评价方法

MaxEnt 模型基于生态位原理,可以只依据物种“存在点”的环境变量特征确定物种分布限制条件,通过识别最大熵分布的可能性对物种生境分布进行预测。本文将76 个油松地理分布样本点和筛选出相关性低的10 个环境特征变量导入MaxEnt v3.4.1,随机选择75%的油松分布点进行建模,25%的油松分布点进行模型验证。本文基于样本点随机最大选取10 000 个背景点进行模拟,在数据处理完毕后,其他参数保持默认值。本文采用非阈值依赖的受试者工作特征曲线(receiver operating curve,ROC)下面积AUC 评价模型,AUC 越接近1,说明预测的结果越准确[15-16]。

1.4 油松适生区等级划分

将MaxEnt 预测结果在ArcGIS 10.5 中转化为栅格数据,并利用其空间分析的重分类工具依据自然分割法(Jenks)和实际情况对适生区栅格数据图层进行合理的划分,共划分为以下4 个等级:0~ 0.2、˃ 0.2~ 0.4、˃ 0.4~ 0.7、˃0.7,其分别代表非适生区、低适生区、中适生区和高适生区。

2 结果与分析

2.1 MaxEnt 模型效果

MaxEnt 模型的构建采用油松75%的随机地理分布样点作为训练集,25%的分布样点作为测试集。AUC在随机预测下为0.500,经过20 次重复建模,ROC 曲线下的AUC值为0.957,测试数据集的AUC为0.935,预测值均在0.90 以上,标准差为0.059,说明MaxEnt 模型具有良好的预测效果,见图2。

图2 MaxEnt 模型ROC 曲线Fig.2 ROC curve of MaxEnt model

2.2 伊洛河流域油松潜在空间分布格局

MaxEnt 模型的模拟结果表明,伊洛河流域内模拟油松潜在适生区的面积总计为9 075 km2,约占伊洛河流域总面积的46.98%,说明在伊洛河流域油松可以大量分布。其中,流域内油松的高适生区面积约为3 064 km2(表3),占流域总面积的15.86%,平均适生生长概率为0.866,中位数为0.878(图3),主要位于伊洛河流域的中南部,呈连续带状分布,一小部分呈离散状分布于伊洛河流域的西北部(图4);中适生区面积约为3 015 km2,占流域总面积的15.61%,平均适生生长概率为0.541,中位数为0.536,主要分布在高适生区边缘,分布格局与高适生区基本一致,主要分布在流域南部,呈连续带状分布;低适生区面积约为2 996 km2,占流域总面积的15.51%,平均适生生长概率为0.300,中位数为0.299,在流域西南部呈离散带状分布,与中适生区交界较大,分布范围较广。低、中、高适生区均以栾川县、卢氏县、洛南县等为主要代表区域。而非适生区面积约为10 241 km2,占流域总面积的53.02%,平均适生生长概率为0.047,中位数为0.022,主要分布在流域中部和东南部,其中有一小部分位于西部,分布区域多为连续型,分布于流域的大部分地区。

图3 油松适生分布区存在概率的25%~ 75%分布范围、最值、中位线和均值Fig.3 Probability for suitable distribution of P.tabuliformis

图4 油松在伊洛河流域的适生分布区Fig.4 Suitable distribution area of P.tabuliformis in the Yiluo River Basin

表3 伊洛河流域范围内油松适生区分布面积Tab.3 Areas of suitable distribution of P.tabuliformis in the Yiluo River Basin

2.3 影响伊洛河流域油松分布的环境主导因子

Jackknife 检验结果表明,仅使用单变量时,正则化训练增益由高到低前5 个环境变量依次为降水季节性变化(bio_15,0.890 6)、平均年降水量(bio_12,0.87 9)、土壤类型(Soil Type,0.875 4)、温度季节性变化(bio_4,0.874 3)、最干月降水量(bio_14,0.854 4)(图5A);测试增益由高到低前5 个环境变量依次为平均年降水量(bio_12,1.050 2)、土壤类型(Soil Type,1.025 4)、降水季节性变化(bio_15,1.004 4)、最干月降水量(bio_14,0.995 7)、温度季节性变化(bio_4,0.959 1)(图5B)。在所有环境变量中,平均年降水量、土壤类型、海拔、降水季节性变化、等温性的贡献率依次为35%、24.8%、19.9%、9.2%、7.1%,位居贡献率前五位。而置换重要性前五位依次为降水季节性变化、海拔、平均年降水量、等温性、土壤类型,其重要性数值分别为28.9%、14.9%、14.8%、14.1%、10.8%(表4)。由响应曲线结果表明,油松适宜生长土壤类型为黄褐土和棕壤,降水季节性变化范围为70~ 74 mm,平均年降水量为710~ 850 mm,气温季节变化范围为7.8~8.5 ℃,海拔范围在1 156 m 以上(图6)。

表4 相关环境变量的贡献率、累计贡献率和置换重要性Tab.4 Single and cumulative contribution rate and permutation importance of some environmental variables

图5 环境变量训练和测试集的重要程度Fig.5 Importance of training and regularization of environmental variables for P.tabuliformis in Yiluo River Basin by Jackknife test

图6 Maxent 模型降水季节性变化、温度季节性变化、土壤类型、海拔和平均年降水量的响应曲线Fig.6 Response curve of seasonal variation of precipitation,seasonal variation of temperature,soil type,elevation and mean annual precipitation

3 讨论

3.1 MaxEnt 模型模拟效果

物种潜在分布模型多种多样,比如基于统计分析的GLM、GAM、RF、DOMAIN、MaxEnt 模型和GARP、ANN 等模型[11],其中,MaxEnt 模型能使用分类变量,具有源码开放、操作简便、模拟精度高的特点,被广泛认为是生态建模中性能最好的方法之一[12-20]。此外,油松是大型木本植物,与草本植物相比,生态位宽度大且保守程度较高。因此,本研究选用MaxEnt 模型来模拟油松的潜在分布。但MaxEnt 难以考虑生物相互作用和偏向于保守生态位,模型过于复杂时可能难以用生态学原理解释。因此,本文经过采样偏差处理和变量相关性分析等方式来降低模型误差,提高模型的预测精度。本文基于AUC 参数检验模型性能,受试者操作曲线(ROC)下的面积(AUC)不受阈值限制[21]。MaxEnt 评价结果表明,训练和测试AUC 分别为0.957 和0.935,说明模型模拟精度达到优秀水平。但是预测结果与实际分布仍然具有一定的拟合误差,其原因一部分可归结为环境数据误差。生态位预测需要充足的环境数据,如果一部分生态位处于收集的环境变量范围以外,则模拟出来的是受空间限制而缩小的生态位,或模型未包含完整的重要环境变量时,模拟的生态位大于现实生态位,从而导致误导性预测的产生。

3.2 MaxEnt 模型优化

本文采用空间距离筛选法来处理样本点,去除63%的采样点,采样偏差有多种处理方法,比如聚类分析、空间距离筛选法或空间限制法等[22]。另外,环境因子之间存在空间线性关系,尤其降水量、温度环境因子相关的衍生变量之间共线性关系更为明显。为了便于更好地解释油松分布与预测因子之间的关系,本文借助Spearman和Pearson 相关性分析缩减变量,同时保证模型具有足够的变量来描述油松的生态位。对于相关性分析,目前还没有统一标准,一般阈值取值在0.6~ 0.9[23-24],当预测变量过多时,阈值可适当提高,以选择生态学意义较高的变量,同时保证筛选的变量都能反映物种的有效特征。但当样本数量小于模拟变量时,筛选标准应侧重于其生态学意义,而不是相关性[22]。对气候因素来说,降水量是影响油松生长的关键因素,温度次之。与气候相比,地形、土壤等非气候环境因素在物种分布的重要性增加,尤其对于植物,土壤因子在一定的区域尺度上对植物分布有重要影响,在我们的研究中,海拔、土壤类型都是油松分布的主导因子之一。油松为深根型树种,根系主要分布在40~ 80 cm 土层,土壤结构对植物生长有重要的影响。对其他土壤因子,土壤含水率、有机质含量等与林分密度有关[25],其他土壤养分与油松林龄有关[26],且随气候变化波动较大,不宜作为预测油松林生态位的环境因子。

3.3 油松分布与环境变量的相互关系

对于气候因素来说,降水量是影响油松生长的关键因素,温度次之,与梁非凡、何如梦等[25-27]的研究结果相似。但在关于降水量、温度的衍生变量方面,肖敏等[2]认为,最暖冷月温度差、最冷月平均温度等是其主导因子。造成这种差异的原因,一方面,是数据来源、处理方式以及预测变量等建模数据不一致;另一方面,是预测参数调整的差异,MaxEnt 模型参数较多,优化方案多样,预报效果不一。

与气候相比,地形、土壤等非气候环境因素在物种分布的重要性增加[28],尤其对于植物。土壤因子在一定的区域尺度上对植物分布有重要影响[29]。本研究发现,土壤类型是油松分布的主导因子之一,土壤结构对植物生长有重要影响[31]。对其他土壤因子,油松林的土壤含水率、有机质含量等与林分密度有关[32],其他土壤养分与油松林龄有关[33],且随气候变化波动较大,不宜作为油松林的预测因子。

4 结论

根据MaxEnt 构建的模型模拟伊洛河流域内油松潜在适生区面积总计为9 075 km2,其中,高适生区面积约为3 064 km2、中适生区面积约为3 015 km2、低适生区面积约为2 996 km2,低、中、高适生区分别以栾川县、卢氏县、洛南县等为主要代表区域。影响油松适生区的主要环境因素包括,年平均气温等温性、温度季节性变化、平均年降水量、最干月降水量、降水季节性变化、土壤类型、坡度、坡向、海拔。在所有环境变量中,平均年降水量、土壤类型、海拔、降水季节性变化和等温性的贡献率分别为35%、24.8%、19.9%、9.2%和7.1%。而置换重要性前五位依次为降水季节性变化、海拔、年平均降水量、等温性、土壤类型。建议在伊洛河流域下游地区的油松生长适生区内应该适当增加油松林分的种植密度,建议在流域的西南地区(卢氏县、栾川县等地)适当增加人工油松林种植点,尤其在河网密度较大,水土流失严重的地区,而在流域南部和中部建立油松林保护基地。

猜你喜欢
环境变量适生区油松
基于物种分布模型的画稿溪国家级自然保护区桫椤保护现状及影响因素*
油松松梢螟防治技术
基于组合模型预测蛇足石杉在中国的适生区
油松容器育苗技术
从桌面右键菜单调用环境变量选项
气候变化下濒危植物半日花在中国的潜在分布
彻底弄懂Windows 10环境变量
油松混交林与纯林土壤理化性状比较
巴拉圭瓜多竹适生区分布研究
北方油松育苗技术