基于BP神经网络模型思茅松天然林生物量遥感估测

2017-12-19 08:11吴娇娇欧光龙舒清态
中南林业科技大学学报 2017年7期
关键词:天然林普洱样地

吴娇娇,欧光龙,舒清态

(西南林业大学 林学院,云南 昆明 650244)

基于BP神经网络模型思茅松天然林生物量遥感估测

吴娇娇,欧光龙,舒清态

(西南林业大学 林学院,云南 昆明 650244)

以普洱市思茅松天然林为研究对象,以Landsat8 TM影像和DEM(30 m)数据为信息源,结合2006年森林资源二类调查小班数据和2012至2013年样地实测数据,在ENVI下提取14个自变量备选因子(11个遥感因子、3个地形因子),在MATLAB平台下利用BP神经网络模型建立研究区思茅松天然林生物量估测模型。结果表明,利用优选训练算法Ploak-Ribiere,隐含层节点数为9时效果最佳,得到决定系数R2=0.85,均方误差RMSE=14 t/hm2,预估精度P=74.75%。以像元为单位,分块提取思茅松对应的自变量,利用估测模型得到普洱市思茅松天然林总生物量为62 185 871.9 t,单位面积生物量为51.06 t/hm2。

思茅松;生物量;BP神经网络

森林生态系统是生态圈的重要组成部分,具有涵养水源、防风固沙、美化环境和维护生物多样性等生态作用和经济价值。生物量作为森林资源最重要的衡量指标之一,是评价碳储量的重要参数[1-2]。传统森林生物量估测方法基于大量的实地调查,导致工作周期长,耗费较多的人力、物力,且无法实现大尺度范围内的生物量估测。遥感技术的出现极大改善这一滞后的现象,成为生物量动态监测和大区域反演的高效、便捷的新技术。近年,光学遥感、微波遥感、激光雷达等的融合数据较多的应用于生物量估测,极大提高生物量估测的工作效率和准确性[3-4]。在生物量的模型算法上,仍然存在一些不足。大多数生物量估测基于线性回归、偏最小二乘、数量回归等线性参数模型,其无法克服遥感因子之间的复共线性缺陷,此时便不再适用。非参数模型有效的解决这一问题,黄金金等基于POS_SVM法进行森林地上生物量遥感估测[5],戚玉娇等基于KNN法实现森林地上碳储量遥感估测均取得较好效果[6],而利用BP神经网络模型对普洱地区思茅松林进行生物量估测研究目前鲜有报道。

思茅松属于Pinus kesiya var. langbianensis暖温带常绿针叶林,广泛分布于普洱境内,是云南省南部、中部、西部海拔在1 500 m以下的主要树种,该树种端直高大、生长速度快,木材用途广,具有较强的实用价值和经济价值。本研究基于MATLAB软件,采用BP神经网络模型结合Landsat8遥感影像数据和样地实测数据,对普洱市思茅松林生物量进行非参数算法的遥感估测,以期对运用遥感数据进行大范围的生物量估测起到一定的参考和借鉴。

1 材料与方法

1.1 研究区概况

普洱(22°02′~ 24°50′N,99°09′~ 102°19′E)位于云南省西南部,属云贵高原边缘,横断山系南段延伸的余脉山地,全市地势北高南低,最大高差达2 990 m。研究区受海拔变化大和季风气候的影响,形成地域差异大、垂直气候复杂多样等气候特征;年平均气温在15.3~20.2 ℃之间,年降雨量在1 200~2 000 mm之间,夏无酷暑,冬无严寒,干湿季分明。普洱市下辖1市区,9个自治县,土地总面积为44 361 km2,其中林业用地占全市土地总面积的70.5%;具有季节雨林、山地雨林、风常绿阔叶林、暖温性针叶林等多种植被类型,思茅松作为暖温性针叶林的代表,也是该区的优势树种,用途广泛多样。

1.2 研究数据

1.2.1 遥感影像数据

本研究所采用2014年3月分辨率为30m的Landsat8遥感影像数据,均从美国地质勘探局官网(http://glovis.usgs.gov/)下载得到。根据研究区行政区划分布图可知,需六景条代号为129/044、130/043、130/044、131/043、131/044、131/045 的遥感影像。运用ENVI5.1对影像数据进行辐射定标、大气校正、几何校正、拼接、裁剪等预处理,得到普洱市Landsat8 TM遥感影像图。

1.2.2 实测数据

本研究于2012年12月和2013年12月共实地测得分别位于墨江、思茅、澜沧等地共45块20 m×30 m的思茅松天然林样地,包含不同龄级、不同海拔、不同生物量水平的思茅松林,具有代表性和可研究性(见表1)。样地的调查因子有郁闭度、样地株数、林分平均高、林分平均胸径、样地坐标等。并于2012年基于不同的径阶分布实测120株思茅松生物量,记录了树龄、树高、胸径、冠幅等测计参数,其生物量计算方法根据胥辉等提出了生物量计算方法得到[6]。

表1 样地概况Table 1 General situation of sample plot

1.2.3 辅助数据

2006年普洱市森林资源二类调查小班数据和研究区行政区划矢量图,在Arcgis10.2中提取出该区域内所有的思茅松天然林,图1为普洱市思茅松天然林Landsat8 TM RGB754彩色合成图。采用分辨率为30 m的DEM图用于地形因子的提取。

1.3 研究方法

1986年,Rumelhart和McCelhand等人提出多层网络的误差反向传播学习算法,简称BP(back propagation)算法。BP网络结构中包括输入层、隐含层、输出层,每层神经元互不相连,而不同层间相互连接。它是一种多层前馈型神经网络,将学习的结果反馈给中间的隐含层单元,不断调整权系数矩阵,从而使输出结果不断逼近期望值,达到预期学习目的并解决多层网络的学习问题[7-8]。目前,在人工神经网络的应用中,大部分采用BP神经网络及其变化形式,成为迄今为止最常用、最普遍的网络。BP神经网络在应用中仍然存在一些不足,由于非线性网络的误差面比较复杂,多层网络中往往出现多个局部最优解,而没有全局最优解[8]。图2为BP神经网络结构图,图中X1,X2,…,Xn为输入值,Wij和Wjk为权值,Y1,Y2,…,Yn为BP神经网络的估测值。根据文献[9],任意3 层BP神经网络隐层节点数可以根据公式(S为隐层节点数;j、k分别为输入层和输出层节点数;l取1~10 之间的整数)来确定取值范围。在本文中采用该方法寻找最佳隐含层节点数。

2 研究内容

2.1 样地生物量计算

图1 思茅松天然林TM遥感影像图像Fig. 1 Remote sensing images of natural Simao pine forests

图2 BP神经网络结构Fig. 2 The structure of BP networks

根据实测的120株样木生物量,推算出样地思茅松生物量并用于模型建立。鉴于众多学者已有的研究表明,幂函数在思茅松林生物量模型拟合和构建中具有较好的效果,因此以幂函数作为基本运算形式,以树高(H)、胸径(D)及其组合参数(D2H)作为自变量,进行单木生物量模型的构建[10],见表2。

表2 单木生物量模型构建Table 2 Construction of the model of individual tree’s biomass

从模型的精度可知,第二个模型W2=m×Dn×Hr效果最好,因此作为单木生物量模型。并采用平均标准木法计算样地单位面积思茅松生物量。

式(1)中: W为思茅松样地生物量;m,n,r为单木生物量模型系数;D标为各样地标准木平均直径,H标为各样地标准木平均树高;u为样地思茅松株数。

得到样地生物量后,除以20 m×30 m的样地面积,得到单位面积生物量。

2.2 提取自变量参数

自变量的选取包括遥感因子、地形因子等14个参数。对普洱市Landsat8TM遥感影像2~7的可见光和红外波段进行线性和非线性组合以不同程度增强或抑制绿色植被信息,选取11个遥感因子,包括影像的2~7波段、差值植被指数(DVI)、比值植被指数(RVI)、有效叶面积植被指数(SAVI)、归一化植被指数(NDVI)、大气阻抗植被指数(ARVI);基于研究区的DEM数据,提取样地点相应的海拔(DEM)、坡度(SLOPE)、坡向(ASPECT)3个地形因子作为备选自变量。

表3 思茅松林遥感估测模型备选自变量Table 3 Independent variables for remote sensing estimationof Simao pine’s biomass

2.3 基于不同训练算法BP神经网络模型的构建

参与建模的样地点共45个,随机不放回的选取70%的样本,即30个样地点用于测试集模型建立和参数寻优;30%的样本,即15个样地点进行模型精度验证[11]。保证建模样本和验证样本没有出现重复现象。由于模型的自变量和因变量参数存在不同的数量单位,为了克服量纲相异的影响,需对所有数据进行标准化处理。在MATLAB平台中对各参数进行归一化处理,使各数值介于[0,1]。否则,不予参与建模[12]。

在MATLAB软件中,调用其自带的神经网络,实现模型建立、模型估测和预测值计算。本研究基于BP神经网络模型,使用三种不同网络训练算法进行思茅松林生物量估测,分别为Powell-Beale共轭梯度法、Fletcher-Reeves共轭梯度法、Ploak-Ribiere。将3种训练算法结果进行对比,采用最优算法实现生物量估测。在建模过程中,网络隐含层中的神经元数目过少会引起网络的不适应性,过多则引起过适应性,由于共有14个因子参与建模训练要求精度为0.000 01,设置隐含层和输出层的节点个数为14,最大训练次数为15 000,动量因子为0.8,学习率为0.01。

3 结果与分析

3.1 不同训练算法精度对比

模型构建好后,使用xlread函数读取建模因子表格,分别使用2.3中提到的3种网络训练算法,每种算法训练5次。计算平均迭代次数、决定系数(R2,公式2)平均值、均方误差(RMSE,公式3)平均值(单位:t/hm2),预估精度(P,公式4)平均值。

表4 3种不同训练算法结果对比Table 4 Comparison of three different algorithm

见表可知,Ploak-Ribiere算法结果最优,R2和P值均大于另外两种训练算法,拟合效果较好;其均方误差大于Fletcher-Reeves共轭梯度法,而Powell-Beale共轭梯度法拟合效果最差,但其模型精度效果较好,仍然具有一定的使用和借鉴价值。

3.2 优选算法精度分析

在3种网络训练算法中,Ploak-Ribiere算法结果最优,根据模型5次的训练结果,对偏差统计量进行分析并评估模型的预估能力,计算模型的总体相对误差(Rs,公式5)、平均相对误差(E1,公式6)、总体相对误差绝对值(E2,公式7)。

由表5可知该模型拟合效果较好,精度较高,满足估测要求。

图3 优选算法实测值与预测值对比Fig. 3 Measured compared with predicted based on optimization algorithm

表5 优选算法精度解析Table 5 Precision analysis of the optimization algorithm

3.3 优选算法隐含层最佳节点数确定

以上3种训练算法对比过程均在节点数S=15情况下的到,不影响对比分析。为了进一步优化训练函数,求解估测模型的隐含层最佳节点数,根据在[5,15]上依次取值。见表6,随着节点数增加R2增加,RMSE减小,当S=9时,R2=0.85,RMSE=14,P=74.75%模型估测精度达到最高。因此,基于优选训练算法Ploak-Ribiere,当节点数为9时效果最佳。

3.4 普洱市思茅松天然林生物量估测

基于上述对比可知,使用Ploak-Ribiere训练算法,隐含层节点数为9的BP神经网络结构模型的效果最佳,采用该模型进行普洱市思茅松天然林生物量估测。由于研究区思茅松面积过大,很难实现一次性计算,将普洱市分割为许多小块,累计叠加得到该区域生物量总量。普洱市思茅松天然林生物量为62 185 871.9 t。

表6 优选算法不同隐含层节点数对比Table 6 Compared with the different hidden layer’s nodes based on optimization algorithm

4 结论与讨论

采用Ploak-Ribiere训练算法的BP神经网络模型,设置隐含层节点数为9时,R2为0.85,RMSE为14,P为74.75 %估测得到普洱市思茅松天然林生物量为62 185 871.9 t,虽然具有一定的参考价值但是仍然存在一些不足。

(1)采用BP神经网络模型估测生物量,并没有统一的参数设定模式,只能通过不断地实验的对比,需花费很多时间和精力。找到一个普适性的参数设定模式,以提高模型的精度和计算效率,是亟待解决的关键问题。

(2)在隐含层最佳节点数实验中,节点数增加模型效果有明显好转,但达到一定数值后,精度则会下降。是否存在一定的规律可循,有待进一步研究。

(2)样地生物量是由单木生物量模型推算得到,并不是实地测量得到。因此由于误差的传递性,会对普洱市思茅松天然林的生物量预测造成一定的影响。

(4)参与建模的自变量因子中包括遥感因子、地形因子共14个参数,增加其他自变量参数如地面调查因子郁闭度等,会对模型精度的提高有很大的帮助。

(5)普洱市思茅松天然林总面积约12 178.98 km2,面积较大,而模型的估测精度为74.75 %,因此在整个研究区的生物量反演上,差值会增大,仍然存在一定的局限性。如何提高大范围的生物量遥感估测精度,日后应加强这方面的研究和学习。

[1]娄雪婷, 曾 源, 吴炳方. 森林地上生物量遥感估测研究进展[J]. 国土资源遥感, 2011,22(1): 1-8.

[2]国庆喜, 张 峰. 基于遥感信息估测森林的生物量[J]. 东北林业大学学报, 2003, 31(2): 13-16.

[3]邵明晓,文仕知,何功秀,等.不同林龄闽楠人工林生物量结构特征[J].中南林业科技大学学报,2014,34(6):44-48.

[4]孟先宇. 测树学[M]. 北京:中国林业出版社, 1996.

[5]董金金. 基于PSO_SVM的森林地上生物量遥感估测与空间分析[D]. 泰安:山东农业大学, 2014.

[6]戚玉娇. 基于KNN 方法的大兴安岭地区森林地上碳储量遥感估算[J]. 林业科学, 2015, 51(5): 46-54.

[7]胥 辉, 张会儒. 林木生物量模型研究[M]. 昆明:云南科技出版社, 2002.

[8]刘 青. 人工神经网络遥感影像分类系统的设计与实现[D].昆明:昆明理工大学, 2010.

[9]史 峰, 王小川, 郁 磊, 等. MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社, 2010.

[10]琚存勇, 蔡体久. 用泛化改进的BP神经网络估测森林蓄积量[J]. 林业科学, 2006, 40(12):59-62.

[11]傅荟璇, 赵 红.MATLAB神经网络应用设计[M]. 北京:机械工业出版社, 2010: 94-95.

[12]Almeida A C, Barros P LC, Monteiro J H A, et al. Estimation of a hove ground forest biomass in Amazonia with neural networks and remote sensing[J]. IEEE Latin America Transactions, 2009,7(1): 27-32.

[13]岳彩荣. 香格里拉县森林生物量遥感估测研究[D]. 北京:北京林业大学, 2011.

Remote sensing estimation of the biomass of Pinus kesiya var.langbianensis forest based on BP neural networks

WU Jiaojiao, OU Guanglong, SHU Qingtai
(Southwest Forestry University, Kunming 650244, Yunnan, China)

Taking the biomass of Simao pine,(Pinus kesiya var. langbianensis)in Puer county as the research target, Landsat TM 8 images,DEM (resolution: 30 meters), the forest resources inventory data in 2006 and the ground sample data from 2012-2013 as the data source.The Simao Pine’s distribution image in the study area was extracted by ENVI,and 14 factors ( 11 remote sensing factors, 3 terrain factors) was selected as the alternative variables. By using BP neural networks module in MATLAB, the estimation model of Simao Pine’s biomass of study area was established. The results showed that the best optimal training algorithm was Ploak-Ribiere and the hidden layer’s nodes are 9, R2=0.85, RMSE=14 t/hm2, P=74.75%. %,and the predicted total biomass of Simao pine was 62 185 871.9 t, the perunit area’s biomass was 51.06 t/hm2in Puer county by taking the pixel as unit and extracting the independent variable factors.

Pinus kesiya var. langbianensis; biomass; BP neural networks

S758.2,S791.245

A

1673-923X(2017)07-0030-06

10.14067/j.cnki.1673-923x.2017.07.004

2016-12-13

国家林业公益性行业专项(201404309);国家自然科学基金项目(31460194)

吴娇娇,硕士研究生

舒清态,副教授,博士;E-mail:shuqt@163.com

吴娇娇,欧光龙,舒清态.基于BP神经网络模型思茅松天然林生物量遥感估测[J].中南林业科技大学学报,2017, 37(7):30-35.

[本文编校:吴 毅]

猜你喜欢
天然林普洱样地
浙江省首个市级天然林保护修复实施方案通过评审
仁怀市二茬红缨子高粱的生物量及载畜量调查
额尔古纳市兴安落叶松中龄林植被碳储量研究
在普洱半山酒店寻找诗和远方
绿色是普洱的底色
基于角尺度模型的林业样地空间结构分析
15 年生鹅掌楸林分生长差异性研究
天津:全面停止天然林商业性采伐
天保工程:把天然林都保护起来
天然林保护任重而道远