基于多源数据的棉叶螨预测研究

2018-08-01 07:53王守会戴建国李栓明张国顺崔美娜
江苏农业科学 2018年13期
关键词:棉叶植被指数棉花

王守会, 戴建国, 李栓明, 张国顺, 崔美娜

(石河子大学信息科学与技术学院/兵团空间信息工程技术研究中心,新疆石河子 832000)

棉叶螨别称棉红蜘蛛,是世界性棉花害虫,在国内外各大棉区均有分布[1-3]。尤其在新疆,夏季高温炎热且干燥少雨,气候条件适宜种植棉花的同时也给棉叶螨种群的生长和繁殖提供了优越条件,使棉叶螨成为新疆地区危害棉花的主要害虫之一,其中被危害严重的棉田可造成30%以上的减产[4],给新疆棉花生产带来了较大损失。如果能够运用科学有效的手段及时准确地对棉叶螨的发生发展趋势进行预测,实现灾前预防,对减少灾害损失具有十分重要的意义。

病虫害的发生发展主要受气候条件(如温湿度、降水量等)影响。基于此,许多学者基于气象数据建立模型在病虫害预测方面做了很多的研究工作,并取得了较好的研究成果[5-7]。其中在棉叶螨发生预测研究中,刘婧然等基于径向基函数神经网络(radical basis function,简称RBF)利用平均气温、最低气温、相对湿度和降水量建立了新疆石河子地区棉叶螨发生程度预测模型[8]。吴昊等对棉红蜘蛛的发生成因进行了分析,并基于气象因子分别建立了棉花苗期和伏秋期螨害等级预测模型,且预测结果均达到显著水平[9]。因此,气候条件是进行螨害预测时须要考虑的关键因素。

除气象因素外,病虫害的发生发展还与农田生境、作物长势等多种因素有关[10-11]。研究表明,当作物受到病虫害胁迫时其叶绿素含量、水分含量、细胞组织结构等生理状态会发生变化,并由此引起光谱特征呈现一定的变化规律[12-13],成为遥感监测的依据。尤其近年来,随着卫星遥感数据获取及处理分析技术的不断成熟,遥感逐渐成为大面积农作物病虫害监测预测的有效手段,学者们对此开展了大量研究。

综合分析,虽然气象环境是导致螨害发生的主要因素,但作物的当前生长状态和受害程度对螨害后续扩散发展也有很大影响。因此,棉叶螨的发生发展受气候环境和棉花当前生理状态2个方面的影响,将能够反映作物生理指标的遥感植被指数与气象数据相结合用于螨害预测研究较为科学合理,该研究方法也逐渐成为研究趋势[14-15]。鉴于此,以新疆生产建设兵团第八师为研究区域,将棉花遥感生理监测与气象因子相结合用于预测研究大面积棉田螨害的发生发展趋势,为新疆棉花生产过程中棉叶螨的合理预防提供理论依据,并为类似的应用研究提供方法参考。

1 材料与方法

1.1 研究区概况

新疆生产建设兵团第八师(含石河子市)地处天山北麓中段,准噶尔盆地南缘,古尔班通古特大沙漠南缘(84°58′~86°24′E,43°26′~45°20′N,图1),属于典型的温带大陆性气候,水资源较为丰富,冬季长而严寒,夏季短而炎热,年平均气温为7.5~8.2 ℃,年日照时数为2 318~2 732 h,无霜期为147~191 d,年降水量为180~270 mm,年蒸发量为1 000~1 500 mm。棉花为全师的主要经济作物,其播种面积每年在19万hm2左右。

1.2 数据来源

1.2.1 遥感数据获取及处理 所选用的遥感数据来源于美国国家航空航天局(national aeronautics and space administration,简称NASA)于2013年发射的Landsat 8卫星,该卫星携带有陆地成像仪(operational land imager,简称OLI)和热红外传感器(thermal infrared sensor,简称TIRS)2个传感器。

OLI设有9个波段,包括可见光、近红外和短波红外波段,其中多光谱波段的空间分辨率为30 m,全色波段的空间分辨率为15 m,成像宽幅为185 km×185 km。影像的获取时间为2017年6月27日和2017年7月13日共2景影像,影像清晰且覆盖整个研究区,能够满足研究需要。

首先对影像进行辐射定标,将图像的数字量化值(digital number,简称DN)转化为辐射亮度值,然后进行大气校正,以消除大气和光照等因素对地物反射率的影响获得真实地物反射率,最后对影像进行裁剪得到研究区的遥感影像。

1.2.2 棉花种植区域提取 利用2017年6月27日研究区遥感影像采用监督分类法对棉花的种植面积进行提取。首先,以曹卫彬等建立的农作物及地块类型解译标志为参考,结合近红外波段合成的假彩色图像对研究区内的7种地物类型(棉花、玉米、葡萄、居民地、山体、裸地、水体)建立感兴趣区作为训练样本[16]。然后选择监督分类中的最大似然分类方法对研究区地物类型进行分类,实现对棉花种植面积的提取。最后利用混淆矩阵对分类结果进行精度评价,总体精度为 97.24%,Kappa系数为0.95,分类效果较好,可以满足后续研究需要。研究区地物类型以棉花为主,其他地物类型相对于棉花属于极少数,存在分类样本不平衡现象,因此可取得较高分类精度。

1.2.3 遥感特征因子提取 利用2017年6月27日(蕾期)、7月13日(花期)的2景遥感影像分别计算病虫害监测研究中常用的7种植被指数[17-19],共获得14种植被指数作为初选遥感特征因子。相关植被指数及其计算公式如表1所示。

表1 相关植被指数及其计算公式

1.2.4 气象数据获取与处理 为全面考虑气象因素对棉叶螨发生发展的影响,共收集全师范围内11个气象站点的气象数据(数据来源于新疆气象网),气象站点分布如图1所示。由于气象站点空间分布离散,所收集的气象数据属于点状数据,而本研究需要获取面状连续的气象数据,因此使用ArcGIS 10.4.1软件对11个气象站点的气象数据采用克里金(Kriging)插值方法进行空间插值分析,从而得到空间连续的气象信息。

1.2.5 气象特征因子选取 根据气象对棉叶螨的发生与作用规律,初选2016年11月、12月及2017年1月的平均温度、最高温度、最低温度、平均相对湿度、地表温度、5 cm地温、2016年12至2017年1月累积降水量,2017年1月降水量及极度低温,2月地表温度、5 cm地温,3—4月大于10 ℃积温,3、4、5、6月平均温度、平均相对湿度,4—6月累积降水量,5—6月累积降水量、温湿系数、温雨系数,6月上旬、下旬降水量,5、6月的温湿系数、温雨系数,7月平均温度、最低温度、降水量、温湿系数、温雨系数共47种数据作为气象特征因子。

1.2.6 螨害实地调查数据 于2次卫星过境时间段(2017年6月27日—7月13日)内由人工进行实地调查。考虑到Landsat 8影像的空间分辨率为30 m,因此以30 m×30 m为1个调查单元。在调查单元内采用“Z”字形采样法,每个单元调查8~10点,每点调查10株棉花并记录螨害的发生情况(发病、健康),最后根据红叶株数和调查总株数计算红叶株率,并按照红叶株率进行分级[27]。当红叶株率达到3级时,则认为达到防治要求,将该调查点标记为螨害发生点,否则标记为健康点,并使用全球定位系统(global positoning system,简称GPS)记录该点坐标,共调查106个采样点。

1.3 研究方法

首先,采用Relief算法[28]和泊松相关系数法(poisson correlation)相结合的方法对气象与遥感共61个(47个气象因子,14个植被指数)初选特征因子进行特征降维,获取建模最佳特征;其次,分别使用3种方法(单一气象因子、单一遥感植被指数、气象因子与遥感植被指数相结合)建立预测模型;最后,对3种模型进行精度评价和对比分析,从而获取最佳的建模方法和预测模型,并对整个研究区进行螨害预测,生成螨害发生空间分布图。技术路线如图2所示。

1.3.1 特征降维 首先利用Relief算法计算61种初选特征因子的特征权重(图3)。特征权重越大,表示该特征用于分类模型时的分类能力越强,反之则表示该特征分类能力越弱。设置权重阈值为1 500,小于该阈值的特征将会被移除,最后剩余14种特征。其次,采用泊松相关系数法去除冗余特征,计算剩余两两特征之间的泊松相关系数,并设置相关性阈值为0.85,超过该阈值则认为2个特征之间相关性过高,存在信息冗余,将其中特征权重较小者进行剔除。最终筛选得到6月27日GNDVI、MSR以及7月13日RVI、5—6月累积降水量、5月温湿系数、4—6月累积降水量、6月上旬降水量共7种特征因子。

1.3.2 模型建立 螨害的发生与否属于非线性二分类问题,Logistic回归是解决二分类问题非常有效的方法之一,该算法能够很好地解释在一定条件下事件发生与否的概率[29]。因此,本研究采用Logistic回归建立螨害预测模型。螨害发生与否的表示方法为发生记为1,未发生记为0。Logistic回归模型为:

(1)

式中:β0为常数项;β1、β2、…、βp为Logistic模型回归系数;x1、x2、…、xp表示p个自变量;P表示在p个自变量的作用下发生螨害的条件概率,P≥0.5表示发生螨害,P<0.5表示健康。

对公式(1)作Logit变换,Logistic回归模型可以变成线性形式:

(2)

1.3.3 精度评价 将准确率(Acc,公式3)、精确率(P,公式4)、召回率(R,公式5)和F1值(公式6)作为分类器的评价指标。各种指标的计算方法如下:

(3)

(4)

(5)

(6)

式中:TP表示将正类预测为正类数;FN表示将正类预测为负类数;FP表示将负类预测为正类数;TN表示将负类预测为负类数。

2 结果与分析

2.1 预测模型比较

分别使用单一气象因子(2017年5—6月累积降水量、5月温湿系数、4—6月累积降水量、6月上旬降水量,记为模型1)、单一遥感植被指数(6月27日GNDVI、MSR以及7月13日RVI,记为模型2)以及气象因子与遥感植被指数相结合(全部7个特征,记为模型3)3种方法进行Logistic回归建模。其中,2/3的数据样本用来建模,1/3用来精度验证。由表2可以看出,3种模型在测试集上的准确率相较于训练集上的准确率均有所下降,表明该分类模型的泛化能力有待提高,但对模型的错分漏分情况分析发现,3种模型整体分类效果较好。通过计算测试集上的精确率、召回率、F1值并对比分析发现,模型3分类效果最好,模型2次之,模型1效果最差。

表2 不同螨害预测模型分类结果对比

2.2 模型应用

分别用3种预测模型对整个研究区的螨害情况进行预测并生成分布图,结果如图4、图5、图6所示。

由图4可知,螨害发生严重地区主要分布在142团、144团、134团、133团和石总场,而在132团、135团、136团、122团、147团和143团部分发生且相对较轻,在150团、149团和148团均无螨害发生。

由图5可知,整个研究区均有螨害发生但整体发生相对较轻,无大面积螨害暴发区域。其中,在136团、135团、132团、133团、134团和142团附近相较于148团、149团、150团和石总场附近螨害发生严重。

由图6可知,螨害发生集中分布于142团附近,在150团、石总场、143团和136团螨害均有发生,但相对较轻,呈零星点状分布。根据调查,2017年研究区棉叶螨发生情况整体呈“南重北轻”的趋势,其中142团发生面积较大,石总场有一定面积发生,其他团场均有轻微点片发生。将模型预测结果与实际情况分析比较可以看出,模型1和模型3的整体预测趋势与实际情况较为相符,说明气象环境的确在整体上对棉叶螨的发生起着重要作用,因此基于气象因子的模型在大尺度上的预测效果比较好,这与前人的研究结果一致。但气象随空间变化缓慢,相邻点差异很小,相比而言,遥感植被指数能够反映空间上更细小的变化,具有更好的洞察能力。因此,对于螨害点片发生的情况,遥感模型的预测效果更好。而气象与遥感结合的模型综合了2类数据的优势,既能反映空间上的变化趋势,也能对小范围点片发生情况进行较为准确地预测。

3 结论与讨论

气象环境和作物生理状况均为棉叶螨的生存环境,决定了其发生发展的趋势,因此,使用其中任何一种数据进行建模均可以对螨害发生发展进行预测。但结果表明,同时使用2种数据综合考虑了影响螨害发生的2大因素,结合了二者的特点和优势,因而所建模型具有更高的精度和更好的预测效果。

对于大尺度区域,气象站点分布离散且不均匀,无法获取研究区连续的气象数据。因此,基于研究区内及周围11个气象站点通过空间插值方法获取空间分布连续的气象数据用于解决该问题。在实际应用时,所采用的空间插值方法和参数的选择会直接影响插值精度,如果选择不当,会使插值效果不理想,将影响预测模型的准确性。此外,越冬基数、棉花品种也是影响棉叶螨发生发展的关键因素,因此在后续的研究中应尽可能将该部分因素进行融合,以提高模型预测精度。

使用的遥感数据来源于Landsat 8卫星。Landsat 8空间分辨率为30 m,即每个像元表示30 m×30 m范围的棉田,由于范围较大,使得完全健康区域和有轻微螨害发生区域之间的光谱差异大大降低。尤其在棉叶螨点片发生初期,健康采样点和螨害点片发生采样点之间的光谱差异更小,如果处理不当会对模型造成干扰,为防止发生这种情况,将红叶株率达到3级以上的采样点认为有螨害发生,这种处理方法势必会对模型精度造成影响,导致螨害早期轻微发生的区域无法得到有效判别,因此,发病样点的红叶株率阈值该如何设定还须进一步研究。如果能够使用无人机进行遥感监测,则会在很大程度上克服这个问题。

基于气象遥感数据建立模型并对新疆生产建设兵团第八师2017年7月棉叶螨进行预测,结果表明,将气象数据和遥感数据相结合能够对棉叶螨发生趋势和分布情况进行较好地预测,该方法可以为新疆地区大尺度区域的棉叶螨预测预报和提前预防提供理论依据,并为相关研究提供借鉴。

猜你喜欢
棉叶植被指数棉花
棉花是花吗?
棉花
不同棉花品种棉叶螨的发生动态
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
棉叶螨无公害防治技术
河南省冬小麦产量遥感监测精度比较研究
主要植被指数在生态环评中的作用
第三讲 棉花肥害诊断及其防治