基于无人机多光谱遥感数据的烟草植被指数估产模型研究

2021-02-24 05:19郭治兴梁雪映朱洪芬毕如田
山西农业科学 2021年2期
关键词:植被指数线性光谱

王 帅,郭治兴,梁雪映,3,朱洪芬,毕如田

(1.山西农业大学资源环境学院,山西太谷 030801;2.广东省生态环境技术研究所,广东省农业环境综合治理重点实验室,广东广州 510650;3.华南师范大学地理科学学院,广东广州 510631)

作物产量预测是国家制定农业政策不可缺少的重要农业情报,及时准确地预测可为农业经营管理提供有效支撑,也是发展精准农业的迫切需求[1]。

近20 a 来,随着卫星遥感技术的发展,国内外利用遥感技术进行农作物产量预测的方法逐渐占据农业领域的重要地位[2-5],基于遥感植被指数的作物估产手段得到迅速发展。任建强等[6]以美国玉米为研究对象,各州为估产试验区,利用归一化植被指数(Normalized difference vegetation index,NDVI)和各州玉米产量构建估产模型。结果表明,利用模型计算的玉米单产相对误差仅为2.12%。LIAQAT等[7]以巴基斯坦的整个印度河流域为研究区,并通过多种植被指数如土壤调整植被指数(Soil adjusted vegetation index,SAVI)和改良土壤调整植被指数(Modified soil adjusted vegetation index,MSAVI)等与小麦单产构建了逐步回归模型,结果表明,该模型决定系数(R2)为0.74。高学慧等[8]利用MODIS 植被指数产品估算了江西省双季早稻总产量,结果显示,增强型植被指数(Enchanted vegetation index,EVI)可有效提高估产准确性。王恺宁等[9]建立了多植被指数组合的冬小麦回归估产模型,指出多植被指数组合估产可实现植被指数的信息互补,提高遥感估产精度。刘明芹[10]基于资源三号遥感影像建立了NDVI、差值环境植被指数(Difference vegetation index,DVI)、比值植被指数(Ratio vegetation index,RVI)和波段4 与烟草产量的复杂山区遥感估产模型,发现NDVI 与产量构建的模型拟合度最高。

传统卫星遥感估产适用于大尺度的农作物,对于小尺度的农作物估产来说,由于其重复周期长,时间和空间分辨率较低以及大气环境的影响,无法及时有效地获取地面准确信息,对农作物产量的预测辅助效果一般[11-13]。而无人机遥感技术的飞速发展弥补了卫星遥感估产的不足。无人机遥感估产主要借鉴卫星遥感估产方法,且具有成本低、空间分辨率高、实时性和受大气影响小等特点[14-16],为遥感在小尺度上的作物估产[17]和地物分类[18-19]等领域提供了新的技术手段,对农作物的监测发展也具有重大意义[20]。

朱婉雪等[21]利用无人机观测冬小麦的3 个生育时期,通过最小二乘法构建不同植被指数产量估算模型,结果表明,在灌浆期各植被指数构建的冬小麦估产模型效果最好,植被指数EVI2 与小麦单产建立的模型精度最高。叶旭君等[22]通过机载高光谱成像仪获取光谱数据,利用人工神经网络等方法构建柑橘产量预测模型;王娣[23]根据在武穴梅川镇试验区获取无人机多光谱数据,并同步获取地面高光谱数据,最后与水稻实际单产进行了估产建模研究。王飞龙等[24]基于无人机遥感对水稻进行了估产建模及产量制图,结果显示,使用不同生育时期的相对归一化光谱指数集(RNDSI)组成的多元线性回归模型是多生育期估产的最优模型,决定系数(R2)达到0.74,绘制的水稻田间产量分布图更直观地显示出不同区域的产量,从而进行更加精准的田间管理。

国内外学者利用遥感技术进行作物估产主要集中在水稻、冬小麦等作物上,在烟草方面的研究较少。在烟草方面,遥感技术主要用于种植面积的提取[25-27]和病虫害监测研究[28-29]。烟草是我国专营专卖的经济作物,每年提供的税收占国家财政总收入的7%~10%。因此,快速准确了解烟草产量等信息,对于提高烟草生产管理具有重要意义。

本试验以广东省韶关市始兴县特色优质烟叶生产示范区为研究对象,利用无人机搭载多光谱相机获得研究区烟草成熟期多光谱影像,提取相关植被指数,并结合烟草地面实际产量数据,构建基于烟草成熟期的回归估产模型;同时比较不同估产模型精度,从而获得烟草成熟期最佳回归估产模型,为小尺度区域烟草精细化管理提供可靠辅助信息。

1 材料和方法

1.1 研究区概况

研究区位于广东省韶关市始兴县马市镇都塘中心岗(114°11′E,25°3′N),是始兴县的特色优质烟叶生产示范区,面积为86.7 hm2。温度是烟草生长的关键因素之一,在烟草生长期,最佳生长温度应控制在22~28 ℃,最低不得低于9 ℃,最高不得高于35 ℃。该研究区地处中亚热带季风气候区,年平均温度为19.6~20.9 ℃,烟草生长季节3—6 月平均气温22.7 ℃,一般无霜期296 d,年降雨量1 527 mm,主要集中在4—6 月,与国外优质烟区的温度相当,可以满足烟草最适宜区的生长需求。

试验区的年均日照时数为1 587.66 h,生长期日照时数平均为496.23 h。试验区旱季、雨季较为分明,年降雨量1 435.36 mm,生长期降雨量893.58 mm,3—6 月份降雨量可占到全年降雨量的60%以上。该研究区土壤类型为牛肝土,烟草种植品种为K326,是广东烟区主要种植品种之一。

1.2 数据来源及其预处理

1.2.1 多光谱影像采集 本试验采用国产大疆无人机Phantom 4 Pro 搭载Parrot Sequoia 多光谱相机作为遥感数据采集平台。Sequoia 共4 个单独的1.2MP 传感器,是专为农业应用而设计的,能够获取RGB 三原色遥感影像图以及绿光(波长500 nm,带宽40 nm)、红光(波长660 nm,带宽40 nm)、红边(波长735 nm,带宽10 nm)和近红外(波长790 nm,带宽40 nm)4 个波段数据,获取的遥感影像空间分辨率为0.89 m。该相机配置光照传感器,采用日光照度计进行影像自动校准,避免光照变化造成影像色调不均,也保证不同时期采集的影像的可比性。

试验在2019 年6 月的烟草成熟期进行,无人机飞行时间为6 月2 日,此时烟草还处于生长的鼎盛期。为保证精确度,本试验设置无人机飞行高度80 m,航向重叠度及旁向重叠度均为90%。在无人机飞行前,需在地面布设控制点,采集控制点经纬度坐标,以方便后期的影像配准。飞行当天天气晴朗无云,飞行时间为10:30—14:30,在研究区连续多航次飞行,采集多光谱数据,并采集白板数据,用于后期影像的辐射校正。

1.2.2 烟草样点选取及产量数据获取 为提取所属烟草遥感信息,实地考察研究并获取烟草样点信息,参考已有的资料,在试验区内以地块为单位选择样本。样本的大小与选用多光谱影像的分辨率大小相适应。样本的选取要尽可能多的涵盖大田管理优良和大田管理较差的地块,以保证模型的普适性。筛选所获取的信息,最终选取20 个具有代表性的样点,收集并记录其种植户主、地块编号和GPS信息。

产量数据指的是单位地块的产量,其由烟农提供,由有关单位统一汇总。在产量数据中根据前期所选样本的户主和地块编号信息找出对应产值为样本的产量数据。

1.3 研究方法

1.3.1 技术路线 烟草估产流程如图1 所示,对无人机采集的影像进行拼接、波段合成和图像配准一系列处理,得到研究区的多光谱影像。经波段计算得到植被指数影像,从中提取出植被指数与实际烟草产量构建烟草回归估产模型,比较模型检验指标,以获得适用于该实验区烟草的最优估产模型。

1.3.2 烟草植被指数的选择 考虑到植被指数与作物产量具有良好的相关关系,为了筛选出适合烟草估产的植被指数,根据烟草的生长特性,在正常的生态环境条件下,本研究基于成熟期的烟草冠层多光谱图像和多光谱Sequoia 传感器通道特性,选择并提取出以下5 种植被指数,其计算公式如表1所示。

表1 适用植被指数(VI)及其计算公式

1.3.3 烟草无人机遥感估产模型 考虑到无人机遥感估产方法的及时性和易操作性,根据试验获取研究区样点位置,获取不同植被指数遥感影像图上相应的植被指数数值,绘制植被指数与实际产量的散点图,采用线性回归方程构建植被指数与烟草实际产量之间的回归估产模型。并用模型检验指标决定系数(R2)、均方根误差(RMSE)以及相对误差(RE)评价烟草估产结果。

本试验线性回归模型采用最小二乘法进行建模。

式中,a、b 为常数,VI 为植被指数,n 为植被指数类型。

1.3.4 模型评价指标 本试验采用决定系数(R2)、均方根误差(RMSE)和相对误差(RE)对估产模型进行评价。R2表示因变量的全部变异能通过回归关系被自变量解释的比例,反映模型对实测值的拟合程度,R2越接近1,拟合效果越好;RMSE 是常用的回归模型评价指标,反映了实测值在回归线附近的离散程度;RE 将误差值与实测值联系起来,反映了误差在实测值中所占的比例。RMSE 和RE 越小,模型精度越高。

式中,yi表示实测值(kg/hm2),表示模拟值,表示实测均值,n 表示样本数量。

1.3.5 模型验证 由于样本数目较小,共20 个,故试验中模型均采用留一法交叉验证进行模型验证。即每次选取19 个数据进行建模,剩下1 个数据用于验证,并且重复建模20 次。最后,分析20 组模型的模型评价指标,评判模型估产效果。该方法每次使用尽可能多的数据进行训练,能得到更准确的分类器,在样本量较少的情况下非常有效[35-36]。

2 结果与分析

2.1 烟草植被指数与产量的相关分析

本研究基于成熟期烟草冠层多光谱图像提取出植被指数,采用统计方法对植被指数与产量之间的相关性进行分析。在进行烟草模型构建前,需利用皮尔逊(Pearson)相关系数(r)分析植被指数与烟草产量之间的线性关系。皮尔逊相关系数也可简称为(线性)相关系数,它是一个标量,考虑了2 个自变量之间的线性关系水平,其取值范围介于-1 和1 之间。其中,值的绝对值越接近1,表示线性关系越强,但只能起到衡量作用。利用皮尔逊相关系数,分析得到了植被指数与烟草实际产量的相关系数矩阵(图2)。

相关性矩阵图中对角线表示变量的正态分布检验,结果表明,本试验中相关变量呈微偏态分布,可进行皮尔逊相关性分析。从图2 可以看出,根据传感器特性选出的5 种植被指数与烟草产量的相关系数均在0.6 以上,特别是MSR 表现出与烟草产量高度线性相关,达到0.801。NDVI 与MSR 的相关系数接近于1,表明二者之间具有很强的相关性。

对图2 中的相关系数的检验结果进行t 检验,并统计了植被指数与烟草产量相关系数检验的结果,如表2 所示。由表2 可知,5 种植被指数的皮尔逊相关系数t 检验结果的P 值均低于0.01,达极显著水平,均通过了t 检验,表明其具有统计学意义。进而验证了这5 种植被指数与产量具有显著的线性相关性,因此,这5 种植被指数可作为本试验中烟草建模的产量估算因子。

表2 烟草植被指数特征与产量的相关系数t 检验

2.2 无人机植被指数遥感影像分析

烟草一般在年初的3 月种植,同年6 月中旬收获。烟草生长期一般包括3 个时期,即伸根期、旺长期和成熟期。本试验选取2019 年烟叶生产示范区成熟期的无人机遥感影像。图3 为处理后得到的归一化植被指数(NDVI)、无蓝色波段增强型植被指数(EVI2)、改进简单植被指数(MSR)、改进三角植被指数(MTVI1)和绿色归一化植被指数(GNDVI)的影像图。

2.3 植被指数与实测产量的线性回归估产模型分析

2.3.1 单遥感植被指数线性回归估产模型 由图4 可知,各植被指数与实际产量均呈现正相关性。除MTVI1、GNDVI 与产量的模型R2分别为0.475 8和0.475 2 外,其余单植被指数模型R2均在0.5 以上。其中,以单植被指数yield-MSR 遥感估产模型的R2最高,达到0.642 1,RMSE 最小,为33.87,RE 为1.86%。虽yield-GNDVI 模型的RE 为1.25%,低于yield-MSR,但结合其余2 个模型评价指标综合评价,yield-MSR 为最优单植被指数线性估产模型,拟合方程为y=122.06x+1 874。

2.3.2 单遥感植被指数非线性回归估产模型 分别建立单植被指数与实际产量的对数、指数、多项式和幂函数等非线性回归估产模型,如图5 所示。

由图5 可知,在所有非线性回归估产模型中,多项式非线性回归估产模型的各植被指数模型R2均高于其他非线性回归模型,且同一种植被指数非线性回归估产模型R2均高于线性回归估产模型R2。其中,多项式非线性回归估产模型yield-MSR 的R2最高,达到0.694 9,RMSE 最低,为31.27,RE 为1.38%。由此可知,选取单植被指数多项式非线性回归估产模型可提高烟草遥感估产精度,最优单植被指数非线性估产模型为y=87.045x2-139.38x+2 058.2。

2.4 遥感植被指数组合与实际产量的回归估产模型分析

根据无人机传感器特性和相关研究试验结果,分别使用了差值、比值和归一化3 种方式对5 种植被指数进行两两组合。因为单一植被指数的光谱特征蕴含信息有限,需要将多种植被指数的光谱特征进行组合,以保证模型的多样性和可靠性。并选用线性回归估产模型,对数、指数、多项式和幂函数等非线性回归估产模型与实际产量进行建模,用R2、RMSE、RE 检验指标评价模型精度。

2.4.1 遥感植被指数组合与实际产量线性回归估产模型 构建烟草成熟期植被指数组合与烟草实际产量线性估产模型(表3),并用模型检验指标R2、RMSE 以及RE 评价烟草估产结果。根据相关系数r 的定义可知,相关系数要在0.5 及以上才有相关性,r 是决定系数R2的平方根,因此,R2应大于0.5×0.5=0.25,在线性回归模型中R2应大于0.3才有意义。故筛选出R2大于0.3 的植被指数组合回归模型。

从表3 可以看出,与植被指数MSR 建立的植被指数组合线性回归估产模型,其决定系数(R2)均高于其他植被指数组合建立的线性回归估产模型,且在单植被指数线性估产模型中,由植被指数MSR建立的线性估产模型的决定系数(R2)也为最高,这与图2 的相关性分析一致。含植被指数MSR 建立的差值植被组合线性估产模型高于归一化、比值组合线性估产模型。植被组合NDVI-MSR 和烟草实际产量建立的估产模型决定系数(R2)最高,达到0.657 2,RMSE 为33.15,RE 为1.79%。基于植被指数组合的线性估产最优回归估产模型为y=-160.82x+1 916.4。估 产 模 型 为y =204.22x +1 876.4、y =142.52x+1 877.3、y=-916.7x+1 689.9、y=-879.77x+2 435.3 的决定系数(R2)均在0.6 以上,RMSE 和RE这2 个模型评价指标也都在可允许误差范围内,故这些估产模型均可以根据实际情况选择性使用。

表3 基于线性建模方法的烟草遥感植被指数组合模型

2.4.2 遥感植被指数组合与实际产量非线性回归估产模型 选用对数、指数、多项式和幂函数等非线性回归方程构建多植被组合与实际产量非线性回归估产模型,根据R2筛选出敏感性最高的遥感植被指数差值组合,并用模型检验指标评价模型精度(表4)。

由表4 可知,在3 种植被指数组合的4 种非线性回归估产模型中,在非线性回归估产模型中,R2最高的植被指数组合均与植被指数MSR 有关,这与植被指数组合线性估产模型结论相一致,且多项式非线性估产模型R2均高于其他3 种非线性回归估产模型R2。对比同一植被组合的线性估产模型和非线性估产模型可知,多项式非线性估产模型R2均高于线性估产模型R2。与单植被指数非线性估产模型R2相比可知,植被指数组合多项式非线性估产模型R2均高于单植被指数非线性估产模型R2,说明植被指数组合非线性估产模型可提高估产模型精度,以多项式非线性估产模型最佳。差值植被组合MSR-GNDVI 非线性估产模型的R2最高,为0.696 8,RMSE 最小,为31.18,RE 为1.47%。基于植被指数组合的非线性估产最优回归估产模型为:y=129.49x2-181.46x+2 066.7。其他植被指数组合非线性估产模型除MSR-EVI2 对数和幂函数非线性回归估产模型外,R2均在0.6 以上,其他2 个模型评价指标也都在可允许误差范围内,故这些估产模型均可以根据实际情况选择性使用。

表4 基于非线性建模方法的烟草遥感植被指数组合模型

2.5 估产模型验证

使用留一交叉验证法比较最优烟草估产模型预测值与实测值,并对估产模型精度进行验证,结果如图6 所示。从图6 可以看出,模型的预测值与实测值显著相关(P<0.01),R2为0.607 3,RMSE 为35.58,RE 为1.6%。

2.6 烟草产量空间分布预测

根据优选出的烟草估产模型进行产量反演,绘制出2019 年研究区的产量反演空间分布预测(图7)。在烟草成熟期,烟田烟草产量分布较为均匀,研究区南、东南部地块产量较高,西部地块产量较低,对比图3 可知,其与植被指数高低分布趋势一致,且图中所展示出的产量预测分布状况与实际收集的田块的实际产量分布情况相一致,故该模型可用于区域烟草遥感估产的快速实现,为小尺度烟草估产经营提供高效管理依据。

3 结论与讨论

本试验以无人机搭载多光谱相机拍摄的成熟期烟田冠层图像为基础,从中提取出的烟草成熟期冠层植被指数为研究对象,研究探讨了其与烟草产量的关系,并建立了估产模型。

利用无人机搭载Parrot Sequoia 多光谱相机作为遥感数据采集平台,能获取较高分辨率的多光谱影像,可快速准确的从影像中提取烟草植被指数数据,从而实现从光谱数据到植被指数数据的转换。构建了单植被指数、植被指数组合与实际产量之间的回归估产模型,并用检验指标对模型进行了检验,同时对不同的回归估产模型的模型精度进行了比较,挑选出最优估产模型,也证明了用无人机多光谱影像进行烟草估产是可行的。

比较线性回归估产模型和非线性回归估产模型可知,单植被指数的线性回归估产模型精度低于非线性回归估产模型,植被指数组合非线性回归估产模型精度高于线性回归估产模型,这与王恺宁等[9]的研究结果一致。在植被组合非线性回归估产模型中,多项式非线性估产模型精度普遍高于其他非线性回归模型,植被组合MSR-GNDVI 的估产模型精度最高,达到0.696 8,RMSE 为31.18,RE 为1.47%。故基于无人机多光谱遥感最优估产回归估产模型为y=129.49x2-181.46x+2 066.7。

在本试验中发现,相比较使用其他植被指数,采用植被指数MSR 建立的烟草估产模型更优,无论是在哪种回归估产模型,由植被指数MSR 介入建立的回归估产模型均表现出良好的拟合性,故在后续的研究中可以植被指数MSR 为主要参数进行烟草估产模型的构建。

本研究表明,基于植被指数构建烟草估产模型结构简单,精度较高,可以快速获取估产模型。但目前利用遥感对烟草进行估产的研究很少,没有统一的标准估产模型,而且从其他研究者的研究成果可知,对于农作物的估产研究大部分是针对某一特定地区采用特定的试验设计开展的研究,不同地区的生态环境、土壤和地理形态都不同,故试验结果具有局限性,所得到的估产模型不具有广泛适用性,不利于模型的推广普及。本试验亦是根据指定试验田进行的估产模型研究,研究结果是否适用于其他地区烟草估产还有待进一步验证。同时,本研究未从烟草其他生育期进行烟草估产,所得估产模型受限于烟草成熟期,可进一步考虑获取烟草整个生育期的影像数据,探究一个适用于烟草不同生育期的遥感估产模型,进而提高烟草估产模型精度,提高模型适用性。

目前,无人机遥感技术还处在不断发展的阶段,高质量的影像获取需衡量各方面因素。因无人机受其电池续航能力的限制,完成区域范围内的航拍可能需要多次飞行,故需要权衡飞行时间与空间分辨率、重叠度设置、载荷等问题。降低飞行高度可提高影像的空间分辨率,但会导致地面覆盖范围的缩小及飞行时间的增加。增加重叠度可提高影像拼接效果,但也会使飞行时间增加。高光谱成像仪比多光谱成像仪拥有更丰富的波段信息,但一套高光谱成像系统质量较大,搭载高光谱成像仪会更加降低无人机的续航能力。因此,在实际试验中,需要根据研究需求和实地情况设计合理的飞行任务。

猜你喜欢
植被指数线性光谱
基于三维Saab变换的高光谱图像压缩方法
基于3D-CNN的高光谱遥感图像分类算法
基于无人机图像的草地植被盖度估算方法比较
金卤灯太阳模拟设备中滤光片的设计
二阶整线性递归数列的性质及应用
非齐次线性微分方程的常数变易法
线性回归方程知识点剖析
线性耳饰
浅谈植被指数的分类与应用