马怡茹,吕新,祁亚琴,张泽,易翔,陈翔宇,鄢天荥,侯彤瑜
(石河子大学农学院/ 新疆生产建设兵团绿洲生态农业重点实验室,新疆石河子 832003)
目前新疆是我国最大的植棉区,2020 年棉花种植面积占全国的78.9%[1]。 为解决人工费用高、劳动效率低的问题,近年来新疆生产建设兵团不断扩大棉花机械采收面积。 化学脱叶催熟技术是棉花机械采收的重要前提[2],机械采收一般要求脱叶率在90%以上,吐絮率在95%以上。 脱叶率是评价棉花脱叶催熟效果、判断采收时间的重要指标。 因此,实现对其快速、准确的监测,能够为棉花脱叶催熟相关研究提供技术支持,为大田机械采收时间的确定提供辅助决策。 目前,在棉花脱叶催熟效果相关研究中,对于脱叶率的调查仍采用传统的人工定点调查的方法[3-5]。 其工作量大,缺乏时效性,且定点调查存在一定的偶然性。近年来,无人机遥感由于其低成本、高分辨率、实时监测等优点,在农业监测上应用广泛[6],这也为棉花脱叶率监测提供了新思路。 棉花叶片脱落会导致棉花冠层图像中绿色叶片减少。 前人基于遥感技术开展了大量监测绿色叶片变化的相关研究[7-8]。 随着数码摄影技术的发展,基于数字图像获取作物生长信息成为更方便、 快捷的手段。 李亚兵[9]利用不同的颜色空间和颜色特征值诊断棉花早衰程度,实现了较好的拟合。王康丽[10]利用无人机获取可见光和热红外图像,计算颜色指数,建立棉花冠层特征参数预测模型,结果证明颜色指数能够反映棉花长势、 叶面积指数。Liang 等[11]通过计算不同颜色空间图像特征信息和支持向量机建立叶片含水量估算模型,结果证明通过图像特征能够较好地反映叶片含水量。Niu 等[12]利用无人机获取RGB 图像计算不同的可见光植被指数, 通过多元线性回归(Multivariate linear regression,MLR) 方法建立玉米生物量估算模型,得出的地上部鲜物质质量和干物质质量估算模型的决定系数(Coefficient of determination,R2)均大于0.8。 根据前人的研究,与卫星数据和光谱数据相比,RGB 图像具有获取容易、成本低、处理相对简单的特点,且模型精度较高。目前基于无人机开展与绿色叶片有关的监测研究主要是关于叶面积指数、 生物量、 植被覆盖度等, 而脱叶率作为评价机采棉脱叶催熟效果的直接指标, 利用遥感手段对其进行监测的研究少有报道。 因此,本研究参考前人在无人机表型监测方面的研究成果,以机采棉为研究对象,分别在不同脱叶剂处理的小区内用无人机获取棉花收获期的RGB 图像和棉花脱叶率数据,分析不同脱叶剂处理下棉花脱叶率与可见光植被指数的相关性, 构建基于可见光植被指数的棉花脱叶率快速监测模型, 为脱叶效果试验提供技术支持, 同时可为大田生产中确定适当的采收时间提供辅助支持。
试验于2019 年进行, 地块位于石河子大学教学试验场二连(44°19′N,85°59′E,海拔:475 m),气候类型为典型的温带大陆性气候,土壤为重壤土,土壤肥力较高。 供试棉花品种为新陆早33 号(对脱叶剂不敏感)和新陆早50 号(对脱叶剂敏感)。4 月24 日按照“一膜三管六行”的模式播种,膜宽2.05 m,行距为(66+10)cm,株距为5.6 cm,每个品种种植4 膜。 6 月14 日浇第一水,之后每7~10 d 灌溉1 次,全生育期灌溉9 次,总灌水量为3 525 m3·hm-2;未施用基肥,追肥随水滴施,全生育期施尿素600 kg·hm-2、 磷酸一铵390 kg·hm-2、硫酸钾180 kg·hm-2。 全生育期按新疆“矮、密、早、膜”的高产栽培技术进行大田管理,并注意防治病虫草害。
根据脱叶剂喷施时间,将试验区划分为6 个长度为10 m、宽度为8 条膜的主小区,小区两侧设保护行。 根据脱叶剂喷施剂量,将主小区划分为8 个长10 m、宽度为2.28 m 的副小区,每个品种各种植4 个小区。 于8 月20 日开始进行脱叶剂处理,按T1(8 月20 日)、T2(8 月23 日)、T3(8月30 日)、T4(9 月7 日,大田常规喷施脱叶剂的时间)、T5(9 月14 日)和T6(9 月21 日)6 个时间处理在不同的主小区分别喷施不同剂量的脱叶剂。 脱叶剂喷施剂量设置C1(清水,CK)、C2(脱吐隆150 mL·hm-2+专用助剂750 mL·hm-2+乙烯利1.2 L·hm-2)、C3 (脱吐隆300 mL·hm-2+专用助剂750 mL·hm-2+乙烯利1.2 L·hm-2)、C4(脱吐隆450 mL·hm-2+专用助剂750 mL·hm-2+乙烯利1.2 L·hm-2)。 按照从两边到中间逐渐增加用量的原则, 对主小区内每个品种的4条膜分别喷施。 本试验所用脱吐隆(总有效成分质量浓度:540 g·L-1,敌草隆质量浓度:180 g·L-1,噻苯隆质量浓度:360 g·L-1,为悬浮剂)及专用助剂由德国拜尔公司生产。
1.2.1农学参数。 在每个小区内选择长势均匀、相邻且具有代表性的10 株棉花, 分别于喷施脱叶剂前和收获前调查其总叶片数,并计算其脱叶率。 脱叶率(rD)计算公式如下:rD=(N0-N1)/N0,式中N0、N1分别为脱叶剂处理前的总叶片数、收获前的叶片数。
1.2.2无人机影像。 在棉花收获前, 使用Phantom 4 Advanced 航拍无人机(中国深圳,大疆)采集整个试验棉田小区的高清彩色图像。 图像采集时设置镜头垂直向下,等时间间隔拍照,设置飞行高度为10 m,航向及旁向重叠度为80%,相机快门速度为1/240 s,感光度ISO 值为100。 试验共获取棉田图像387 幅, 图像尺寸为5 472×3 648 像 素, 格 式 为JPG。 使 用Pix4Dmapper(Pix4D,瑞士)软件将获取的图像拼接成正射影像,拼接后的正射影像以TIFF 格式存储,保留地物红、绿、蓝3 种色彩的灰度信息,每种色彩含有8 位字节信息,数值范围为0~255。 根据小区设置, 将拼接完成的棉田影像裁剪成48 个感兴趣区域。
1.2.3棉花冠层可见光信息提取。 将剪裁好的图片, 利用Python 提取每个小区的棉花冠层红(R)、绿(G)、蓝(B)信息,并计算其平均数字量化值(Digital number,DN),进行归一化后得到r、g、b值。根据前人研究结果,选择与植物绿色叶片相关的14 个可见光指数进行计算, 通过相关性分析选择合适的可见光植被指数对棉花脱叶率进行监测。 本研究中使用的14 个可见光植被指数见表1。
表1 本研究中使用的可见光植被指数Table 1 Visible vegetation indexes used in this paper
选取了一元线性回归 (Simple linear regression,SLR)、MLR 和 偏 最 小 二 乘 法 回 归(Partial least square regression,PLSR)建立不同可见光植被指数与棉花脱叶率的监测模型。 将不同品种、脱叶剂剂量及喷施时间处理下采集的48 个样本的棉花脱叶率用于脱叶率监测模型构建,其中36个为训练集,12 个为验证集(表2)。
表2 模型构建的脱叶率数据描述性统计Table 2 Descriptive statistical analysis of model
根据棉花脱叶率监测模型的构建,通过对验证集数据的实测值和预测值进行相关性分析,选取R2、均方根误差(Root mean square error,RMSE)和相对均方根误差(Relative root mean square error,rRMSE)3 个指标对模型精度进行分析。
如图1 所示,在棉花收获前调查不同处理下棉花脱叶情况,以C1 处理为对照,对比发现:随着喷施脱叶剂时间的推迟,2 个品种的脱叶效果都呈升高趋势。 新陆早50 号的最佳效果出现在T5 时喷施脱叶剂, 不同剂量处理的脱叶率与对照相比均有显著差异,增加了52.05~52.50 百分点,各剂量处理间脱叶率并无显著差异。 新陆早33 号最高脱叶效果出现在T6 喷施脱叶剂,C2~C4 处理脱叶率与对照相比均有显著差异, 分别增加了58.55、62.04、66.03 百分点,其中C4 处理较对照的脱叶率增幅最高, 但C2~C4 处理间无显著差异。 综上所述,从脱叶率来看,脱叶剂施用时间越晚,脱叶效果越好;随着脱叶剂剂量的提高,脱叶率有所增加,但到一定剂量时,同一时间处理间的脱叶率没有明显的差异。 对比2 个品种,新陆早33 号(对脱叶剂不敏感)需要更晚喷施脱叶剂以及更高剂量的脱叶剂,才能达到预期的脱叶效果。
将各处理棉花脱叶率与14 种可见光植被指数分别进行相关性分析,结果见图2。 除NGRDI外, 其他可见光植被指数都与棉花脱叶率极显著相关(P<0.01),其中TGI、COM2、GLI、ExB、ExG、COM1 的相关性较高 (r>0.70), 相关性最高为TGI,r达0.81。 棉花脱叶率与部分植被指数具有较好的相关性,说明上述可见光植被指数可以反映棉花脱叶情况。
通过相关性分析,选择与棉花脱叶率有极显著相关性的13 个指数,分别构建SLR、MLR和PLSR 模型。 如表3 所示,采用单个可见光植被指数监测棉花脱叶率的SLR 模型中,建模对象为TGI 植被指数时模型的精度最高,R2高达0.66,RMSE达到10.44%,rRMSE为12.87%。
基于多个植被指数建立的模型中,MLR 和PLSR 模型的R2要高于单一植被指数模型,RMSE和rRMSE要低于单一植被指数模型。 如表4 所示,MLR 模型中R2最高为0.71, 其RMSE为10.67%,rRMSE为13.15%;RMSE最低为10.26%;rRMSE最低为12.65%。 在所有的MLR 模型中,当建模对象包括ExB、GLI 和TGI 这3 个植被指数时, 随着建模对象的增加,R2不变或微增,RMSE和rRMSE增加,建模对象增加至7 个时,R2、RMSE、rRMSE均达到最大值。 因此,MLR 模型中的最佳模型为以ExB、GLI、TGI 和ExG 为建模对象的模型, 其R2为0.70,RMSE为10.26%,rRMSE为12.65%。如表5 所示,PLSR 模型中,R2最高为0.70,其RMSE较低为10.01%,rRMSE最低为12.22%; 以ExB、GLI、TGI、ExG、COM2 和COM1 为 建 模 对 象 的 模 型,R2=0.70,RMSE=10.02%,rRMSE=12.22%,RMSE仅较最低值高0.01 百分点,且涉及的植被指数更少,因此认为PLSR 模型最佳。 对比MLR 模型和PLSR 模型R2、RMSE和rRMSE可 知,PLSR 模 型 略 优 于MLR 模型。
表4 不同可见光植被指数的棉花脱叶率多元线性模型(MLR)模型Table 4 Multivariate linear regression (MLR) model between different color indexes and cotton defoliation rates
表5 不同可见光植被指数的棉花脱叶率偏最小二乘法回归(PLSR)模型Table 5 Partial least square regression (PLSR) models between different color indexes and cotton defoliation rates
利用验证集对各回归模型进行外部验证,结果见图3~5 和表3~5。 其中:PLSR 模型的验证模 型R2为0.93 ~0.94,RMSE分 别 为4.97% 、5.00%、5.01%、5.01%、5.02%,rRMSE分别为6.05%、6.10%、6.10%、6.11%、6.11%, 实测值和预测值间均呈现较好的拟合关系。对比SLR、MLR 和PLSR最优监测模型的拟合程度发现:MLR 模型和PLSR模型精度更高,且拟合线均在对角线(图4 和图5中黑实线)下方,预测值整体小于实际值,即在信息提取过程中存在背景信息剔除过度的问题。
表3 不同可见光植被指数的棉花脱叶率一元线性回归(SLR)模型Table 3 Simple linear regression (SLR) models between different color indexes and cotton defoliation rates
本研究通过设置不同品种、脱叶剂剂量及喷施时间处理,发现不同处理棉花脱叶率与对照相比存在显著差异,但处理间差异较小。 通过无人机获取RGB 图像,从中提取可见光植被指数,考虑到大田条件复杂,容易对棉花图像特征造成影响,分别对不同处理下的棉花脱叶率和可见光植被指数进行相关性分析,选择与棉花脱叶率极显著相关的植被指数,利用不同的建模方式建立棉花脱叶率监测模型具有一定的合理性。
从棉花脱叶率角度看,随着喷施脱叶剂时间的推迟,棉花脱叶率总体呈增加趋势。高丽丽等[27]通过研究脱叶剂不同喷施时间下棉花叶片叶绿素荧光动力学参数的变化,发现延迟脱叶剂喷施有利于脱叶剂降低棉花叶片光合能力, 加快衰老,促进叶片脱落,棉铃成熟,与本研究中的发现一致。 宋兴虎等[28]分析不同用量脱叶剂对棉花脱叶率、吐絮率和产量的影响,发现不同用量对不同试验点脱叶率造成的影响不一致,且大部分情况下差异不大,与本研究结果具有一致性。 但本研究未对表征机采棉脱叶效果的其他指标进行研究及监测,在今后研究中将开展相关研究。
本研究利用无人机获取RGB 图像, 以简单的颜色分量构建了14 种可见光植被指数, 建立棉花脱叶率监测模型能取得较好的结果,这与前人从RGB 图像提取其他与绿色叶片相关指标的结果相似[29-31]。 这是由于棉花脱叶率与棉花绿色叶片直接相关,而可见光植被指数能够在一定程度上消除复杂背景信息, 提取出绿色叶片信息。本研究仅从无人机获取的RGB 图像中获取了指数信息,而其中还有更多信息可以挖掘。 如:Che等[32]利用无人机获取不同角度的RGB 图像,通过点云信息建立3D 模型, 利用三维体素法提取叶面积信息,建立叶面积估算模型,其模型真实值与预测值的拟合R2达0.67;Lu 等[33]提出了基于HSV 颜色空间的色彩混合分析方法估算不同分辨率下的植被覆盖度,结果表明该方法能够准确估计不同分辨率的植被覆盖度,其拟合模型平均 绝 对 误 差 为0.02,RMSE为0.025,rRMSE为0.075。 Liang 等[11]基于RGB 图像实现HSV、Lab颜色空间转换, 提取叶片表面颜色和纹理特征,建立叶片含水量定量预测模型,发现较好的泛化性和鲁棒性。 杨俊等[34]利用无人机数码影像提取8 个颜色指数和4 个纹理特征, 发现将纹理特征与颜色特征相融合可提高对小麦生物量和产量的估测精度。 刘畅[35]通过将光谱信息和纹理特征结合优化光谱指标,发现构建的小麦生物量模型拟合效果较好, 模型精度明显高于单一植被指数。RGB 图像与多光谱以及高光谱影像相比信息量更少, 且本研究中对RGB 图像信息的挖掘有限;因此,为提高脱叶率监测模型的精度,在今后的研究与应用过程中,要从图像中挖掘多元信息并融合应用。
本研究基于RGB 图像提取可见光植被指数, 分别用SLR、MLR 和PLSR 方法建立棉花脱叶率估测模型。其中基于多变量的MLR 和PLSR模型效果较好, 这与这2 种方法在作物产量预测[36]、作物生长参数估算[37]、小麦水分含量估测[38]、作物生长状态监测[39]中的研究结果相似。 本研究仅利用RGB 颜色空间下的DN 值进行计算,由于信息量少等问题, 指数间存在较好的相关性,即基于多变量的模型可能存在共线性的问题,这可能是所构建的模型R2仅为0.6~0.7 的原因。田明璐等[40]在利用不同植被指数建立棉花叶面积估算模型时提出了在PLSR 方法的基础上利用连续投影算法进行波段优选,结果表明通过波段优选后建立的PLSR 模型比直接用PLSR 方法建立的模型效果更好,R2为0.86,RMSE为0.13。李梅等[41]采用连续投影算法提取特征波长,建立马铃薯晚疫病下的叶绿素含量估算模型,R2可达0.89。 因此, 在今后优化脱叶率监测模型的过程中,考虑采用不同筛选方法筛选最优特征作为建模对象,以提高模型精度。
以无人机获取数码图像,计算可见光植被指数, 分析14 个可见光植被指数与棉花脱叶率的相关性, 择优分别用SLR、MLR 和PLSR 建立监测模型。 得到以下结论:(1)随着脱叶剂喷施时间的推迟,棉花叶片对脱叶剂的敏感性增强;随着脱叶剂剂量的增加, 脱叶率会在一定程度上提高,但到一定程度后会出现饱和现象。 (2)不同脱叶剂处理下的棉花脱叶率与可见光植被指数都具有较好的相关性,可见光植被指数能够反映棉花脱叶情况。 (3)以MLR 和PLSR 方法建立的模型精度较高,且拟合程度较好。 从计算量及复杂程度角度考虑, 通过MLR 方法, 以ExB、GLI、TGI、ExG 为建模对象建立的模型,能够更好地反演棉花脱叶率。当变量较多时,使用PLSR 构建模型,能够通过计算各成分贡献率,判断模型最佳成分数,提高多变量模型的精度。