基于高分遥感时序多特征差异的粤北地区水田提取

2021-12-14 04:49朱明帮陈晓远胡月明林昌华
西南农业学报 2021年10期
关键词:物候水田时序

王 卫,朱明帮,陈晓远,胡月明* ,林昌华

(1.华南农业大学 资源环境学院,广东 广州 510642;2.广东省土地利用与整治重点实验室,广东 广州 510642;3.广东省土地信息工程技术研究中心,广东 广州 510642;4.韶关学院 英东生物与农业学院,广东 韶关 512005;5.韶关学院 粤北土壤土地中心,广东 韶关 512005)

【研究意义】粮食安全是全球战略安全的重要环节,特别是在重大公共安全事件(如SARS和COVID-19)面前,保障粮食安全是各国首选的战略任务。作为承载粮食生产任务的耕地,维持其一定数量和质量是保障粮食安全的关键途径。对耕地数量和质量监测是耕地利用和保护的热点议题。水稻是我国主要的粮食作物,2019年稻谷的产量约占全球产量的30%[1]。监测水田的变化是估算水稻产量的必要路径,也是评估“垦造水田”等耕地整治工程实施成效的重要手段,而利用时序遥感分析技术具有快速、高效和客观的优点,成为水田监测的主要途径。【前人研究进展】随着遥感数据源的不断丰富和遥感技术的进步,耕地遥感监测的精度和准确度也在不断的提高。中低分辨率的遥感影像适合大尺度区域的耕地变化监测和农业估产,如利用MODIS卫星影像对全国和省域尺度的耕地分布、作物种植面积和种植制度进行监测[2-7],基于时序植被指数和物候期特征实现了大规模快速高效的耕地和作物面积提取和监测。但受制于遥感影像的分辨率,监测精度和多种作物套作的识别精度不高,耕地的边界不够准确。随着多源高分辨率影像的普及,利用高分遥感的光谱和丰富的纹理特征,结合作物的关键物候期,运用决策树和面向对象分类等多种方法,提高耕地的识别精度和提取面积的准确程度,作物的分类也不断细化,农业遥感不仅快速高效,而且向精准和精细化发展[8-11]。但高分辨率的多特征图像,产生高维的数据,数据量大,计算耗时,且高分辨影像对分类的训练要求较高,不便于大区域使用。近年来大数据和云计算技术的发展,开源遥感数据的多尺度场景的应用得以实现。机器学习方法如随机森林法能够利用多决策系统,对遥感影像的多维特征数据借助样本和定量特征进行快速的解译和分类,既提高了结果的准确度,又扩大了高分辨率影像的适用性[12-16]。但是目前基于国产高分卫星影像的云地球,起步较慢,面向专业领域的应用,通用性不强,公众用户应用困难。【本研究切入点】基于高分遥感影像,从农业遥感业务应用出发,探索快速准确和高适用性的方法,是高分辨率遥感领域应关注的热点课题。【拟解决的关键问题】因此本文利用我国自主高分卫星和开源哨兵2卫星数据,选择关键物候期的时序影像,构建时序多特征差异图像,在随机森林法的支持下,实现对粤北地区南雄市水田的识别,达到快速监测水田面积的目标,并为耕地的精准监测提供参考。

1 材料与方法

1.1 研究区与数据

鉴于高分2号卫星影像的幅宽和同时相的区域覆盖较小,以及粤北地区气候和种植制度相同,本文以广东省南雄市为研究区,识别水田并验证区域水田面积。粤北地区包括韶关市和清远市,是广东省重要的粮食基地,水稻种植面积和产量占广东省的1/3以上[17]。南雄市为韶关市代管县级市,地处广东省东北部,大庾岭南麓,毗邻江西,南北两面为山地,中部丘陵沿浈江伸展,形成一狭长盆地,地质学称之为“南雄盆地”[18]。南雄市经济综合发展力位列全省28个山区县(市)第四,位居韶关市(县市)第一,2019年,完成地区生产总值113.84亿元。南雄盆地中部的紫色土,富含磷、钾,黄烟和水稻产量均比较高。2019年南雄市水稻种植面积达28 000 hm2,产量16.7万t,占韶关市的30%,水稻种植以晚稻为主,2019年种植面积约为18 000 hm2[19-20]。

本文利用的卫星遥感影像有广东省高分中心提供的高分2号影像,欧空局和USGS提供的哨兵2号(Sentinel-2)影像。高分2号(GF-2)卫星是我国自主研制的首颗空间分辨率优于1 m的民用光学遥感卫星,搭载有两台高分辨率1 m全色、4 m多光谱相机,幅宽45 km波谱范围为0.45~0.90 μm。高分2号(GF-2)具有米级空间分辨率、高辐射精度、高定位精度和快速姿态机动能力[21]。哨兵2号卫星搭载一台多光谱成像仪(MSI),可覆盖13个光谱波段,波谱范围0.44~22 μm,幅宽达290 km,地面分辨率分别为10、20和60 m。在光学数据中,哨兵-2号卫星影像是唯一一个在植被红边范围含有3个波段的数据,这对监测植被健康信息非常有效[22]。

研究区遥感影像的时相选择为晚稻的关键物候期,包括晚稻主要的生长期和收获期,无云覆盖,或者少量云覆盖的影像。研究区晚稻的生长期为8—10月,11月上旬基本收割完毕,所以本文选择影像的获取时间为生长期的8月初、9月底和10月初以及收割后的11月中旬(表1)。

1.2 研究方法

本文利用遥感影像的多光谱特征和纹理特征,通过关键物候期水田光谱的差异以及植被指数、湿度指数和颜色指数等多指数特征和差异,构建多特征图像,运用随机森林方法识别水田并测算南雄市2019年晚稻种植面积。

1.2.1 指数特征 归一化植被指数(Normalized Difference Vegetation Index,NDVI,公式1)是反映农作物长势和营养信息的重要参数之一[23]。根据该参数,可以知道不同季节的农作物对氮的需求量,对合理施用氮肥具有重要的指导作用,可用于检测植被生长状态、植被覆盖度和消除部分辐射误差等。

表1 数据源及用途

(1)

式(1)中,Bnir为影像的红外波段,Bred为影像红波段。

Vogelmann红边植被指数(Vogelmann Red Edge Index,VOG,公式2),对叶绿素浓度、叶冠层和水分含量的综合非常敏感。它可应用于植物物候变化研究、精细农业和植被生产力建模[24]。

(2)

式(2)中,Bre1为影像的植被红边波段1,Bre2为影像红边波段2。

红边拐点指数(Red-edge Inflection Point,REIP公式3),考虑了叶片的叶绿素含量,值越高叶绿素含量越高。它对叶冠层的微小变化和衰老非常灵敏,可用于精细农业、森林监测、植被胁迫性探测等[25]。

(3)

式(3)中,Bnir为影像的红外波段,Bre1为影像的红边波段1,Bre2为影像红边波段2,Bre3为影像红边波段3。

归一化红外指数(Normalized Difference Infrared Index,NDII,公式4),对农作物冠层的水分含量变化非常敏感,NDII的值越大表示水分含量越多。应用于农作物管理,森林冠层监测,植被胁迫性探测[26]。

(4)

式(4)中,Bnir为影像的红外波段,Bswir1为影像短波红外波段波段。

归一化湿度指数(Normalized Difference Moisture Index,NDMI,公式2)是反应遥感图像中的水体信息和植被含水量[24]。

(5)

式(5)中,Bnir为影像的红外波段,Bgreen为影像绿波段。

亮度指数 (Brightness Index,BI,公式3)代表卫星图像亮度的平均值,该指数对土壤亮度敏感,亮度与湿度和表面盐分的存在高度相关[27]。

(6)

式(6)中,Bred为影像的红外波段,Bgreen为影绿像波段。

颜色指数(Colour Index,CI,公式4)用于区分田间土壤,低值CI与高浓度碳酸盐或硫酸盐相关,较高值与干旱地区的结壳土壤和沙子相关[27]。在大多数情况下,CI与BI和NDVI提供补充信息。用于历时分析,有助于更好地理解土壤表面的演变。

(7)

式(7)中,Bred为影像的红外波段,Bgreen为影像绿波段。

1.2.2 纹理特征 随着遥感影像分辨率的不断提高,面向对象图像分类技术的应用领域愈加广泛。面向对象分类方法是将具有相似光谱和纹理特征的像元组合在一起,形成具有一定几何形状、大小和纹理等特征的空间对象,再以对象为单位进行分类,能够更清晰地提取地物的边界,减少分类图像上的“椒盐现象”,在进行地类变化监测时,能较好的体现不同地类的区域分异特点[28-29]。本文利用Mean Shift算法,对高分2号影像进行多尺度分割,Mean Shift算法是一种高效的统计迭代算法,具有抗噪声干扰和边界保持性好的优点[30-31]。

基于高分影像丰富的纹理特征,分别对晚稻生长期的影像和晚稻收割后的影像进行多尺度分割并做差值分析。高分2号影像上地物的边界特征明显,在晚稻的生长期图像上,水田与其他地类的边界清晰,呈大小不等的图斑对象,水田内部比较均匀。在收割后的图像上,由于水田上没有作物覆盖,边界更加清晰,呈现较大的内部均匀的板块对象。但两期影像上均存在异物同谱现象,需通过时序差值,提高水田边界的提取精度(图1)。

1.2.3 时序差异多特征图像构建 对多光谱遥感影像归一化后进行差值,然后再进行多尺度分割,依据地物的纹理特征和地物光谱的异同建立多尺度分割图像。并联合NDVI、NDII、NDMI、VOG、REIP、BI、CI指数物候期差值图像,建立多指数特征差异图像。由哨兵2号原始影像,高分影像多尺度分割差值图像,NDVI、NDII、NDMI、VOG、REIP、BI、CI指数及指数产值图像,生成26个特征量,作为研究区水田提取的图像。通过波谱分析和波段运算,计算两两时期的指数最大差值,特征量主成分分析,并结合多尺度分割,构建时序差异多特征图像,形成4种图像用于水田提取精度的对比,分别是晚稻生长期影像与当期多尺度分割图像、NDVI、NDII、NDMI、VOG、REIP、BI、CI指数合成的多指数特征图像,晚稻收割后影像与当期多尺度分割图像、NDVI、NDII、NDMI、VOG、REIP、BI、CI指数合成的多指数特征图像,指数差值图像和时序差异多特征图像(图2)。

1.2.4 分类方法 根据两期影像的特征和研究区作物生长情况并结合实地调查,建立水田识别的训练样本,分为林地、水田、其他农用地、水体,人工地表和裸地6种类型的训练样本。

在图像分类的方法上,本文通过对比支持向量机、波谱角和随机森林法,对比运算速度和分类精度,最终选择随机森林法。随机森林方法是一种集成学习方法,能够将多棵决策树集成的一种算法。该算法采用基尼系数对样本数据进行二值分割,从而实现对样本数据的分类,采用加权平均值对数据进行训练以实现回归问题[13,32]。随机森林算法适用于处理高维数据且运行速度相对较快,对于较少的特征样本也有较高的分类精度,近年来在遥感影像分类领域得到了广泛应用。

本文数据处理的步骤主要有遥感影像预处理,多指数特征差异图像构建,晚稻种植面积测算。实验平台为ENVI5.3,数据处理流程如图3所示。

2 结果与分析

2.1 影像特征

根据目标区水稻的生育期和物候差异,2019年8月5日,研究区晚稻插秧完毕,2019年8月13日,水稻处于幼苗期,水田表面呈现水体与水稻交错分布,在影像呈现水体与植被的光谱特征。2019年9月27日处于水稻的灌浆期,水稻的长势最好,植被指数处于最大值,水田在光谱上呈完全植被覆盖。2019年11月11日,目标区水稻收割完毕,水田为土壤裸露地表形态,在影像上呈土壤光谱特征。

图1 高分影像多尺度分割效果Fig.1 Multi scale segmentation effect of high resolution image

图2 指数差值合成图像(a)和时序多特征差异合成图像(b)Fig.2 Exponential difference composite image and temporal multi feature difference composite image

图3 技术路线图Fig.3 Technology flowchart

从最大值最小值上看,2019年8月13日的影像上水田的VOG指数最大而NDMI、CI指数最小,2019年9月27日的影像上水田的NDVI、REIP指数最大,2019年11月11日影像上水田的BI、CI和NDII指数最大而NDVI、VOG、REIP指数最小。利用指数差异,分别构建NDVI、NDMI、VOG、CI、REIP和NDII指数最大差异图像,使水田样本取值在指数差异特征量上均为最大值(图4)。

2.2 不同图像样本特征

分别对生长期的影像、收割后的影像、时序指数差值图像和时序差分指数模型图像的样本可分离度进行分析,结果如表2所示。

a为BI,b为NDVI,c为NDII,d为VOG, e为CI, f为REIP,g为NDMI,横坐标为指数值,纵坐标为像元计数 a is BI,b is NDVI,c is NDII,d is VOG,e is CI,f is REIP,g is NDMI abscissa is index value,ordinate is pixel count图4 水田在三期影像7种指数上的取值范围Fig.4 The range of values of paddy field in the seven indices of three phase images

表2 不同样本类型不同类型图像中的可分离度

表3 不同类型图像精度评估

在生长期影像上,水田与林地,收割后影像上水田与其他农用地、裸地人工地表地类,时序指数差值图像的水田与裸地的可分离值均小于1.8,可分离度较差,在分类图像上容易导致误分。而在时序差分指数模型图像上,水田与其他地类的可分离度均大于1.97,可分离性较好,分类图像误分几率较小。

2.3 精度验证

利用随机森林方法分别对生长期的影像、收割后的影像、时序指数差值图像和时序多特征差异图像进行分类,提取水田的面积,并以实地分类样本检验分类精度和面积的准确程度,发现时序多特征差异图像的水田提取精度最高,Kappa系数为0.97,用户精度为98%,水田面积与农业部门统计的晚稻播种数据差值为240.05 hm2(表3)。

对比4种图像的分类结果,时序多特征差异图像的分类图像中(图5),各地类的边界清晰,误分现象较少,碎图斑少,识别水田的地理位置准确。生长期的应用由于植被覆盖特征上水田与草地等地类光谱相似,而收割后的影像上水田与裸地和其他未耕作土地的光谱相似,导致水田的面积不准确,分类精度较低。而单使用指数差值,会失去图像的多光谱特征,降低水田识别的精度。通过指数差异消除异物同谱现象,高分遥感影像的多尺度分割使地物之间的边界清晰,并保留关键物候期的多光谱特征,并在善于处理高维特征数据的随机森林方法的支持下,使得时序多特征差异图像在提取水田时精度最高。

3 讨 论

2017年中国启动了第三次全国国土调查,主要任务有全面掌握全国耕地等地类分布及利用状况,掌握耕地数量、质量、分布和构成,健全国土等自然资源变化信息的调查、统计和全天候、全覆盖遥感监测与快速更新机制[33]。2020年将全面完成第三次全国国土调查工作,耕地的数量、质量、分布和构成等信息将向社会公布,由于采用了新的调查规程,在调查中发现耕地的数量和质量上存在一定差距。对于业务管理部门,耕地变化遥感精准监测应用存在若干难题。第一,在业务管理应用中所认定的耕地与遥感调查的耕地存在一定的差异。一般认为耕地是种植农作物的土地,但由于社会经济效益的驱动、耕地管控政策和土地整治规模的加大,在业务管理工作中耕地的认定不仅仅局限于种植农作物的土地,如种植果树等树木但耕作层未被破坏可恢复为耕地的土地,多年抛荒撂荒但之前为耕地的土地,从事牧渔生产但多年前为耕地的土地,这使得耕地的数量和质量统计可能出现偏差。而遥感技术通过对耕地的时序监测,能够获取处于农作物生产活动耕地的准确客观的信息。通过农作物主要的物候期,结合区域的多年种植习惯和生产特点,在农作物的关键物候期获取遥感影像,建立基于知识规则耕地提取方法,将能够改善耕地数量监测的准确程度。第二,遥感技术主要是通过对地表覆盖特征及其变化,来实现对耕地的监测,由于全国范围内区域差异大,高分辨遥感同时相全区域覆盖难,农作物种类多,给耕地的遥感精确监测带来了挑战。如何快速准确地全覆盖监测耕地数量和质量变化,是当前耕地遥感监测的焦点[34]。第三,本文通过探索基于多源遥感数据的多维特征,结合县域农作物的物候特征,采用集成学习方法,实现了水田较为准确的提取。由于对研究区的熟悉程度、工作便利性等特点,作者对研究区农作物的生产特点和耕作习惯具备一定的知识判断,在建立训练样本时较为准确,但是如果面向市域、省域乃至全国尺度时,就需要综合区域物候、种植作物和耕作制度等差异及耕地业务管理行为,进行综合判断,才能准确地提取耕地信息。那么发展基于专家知识库和知识规则的遥感监测决策系统是解决耕地监测难题的途径之一,这也是近年来大数据和云地球努力实现的目标。第四,在耕地质量的评价和监测领域,遥感技术的应用研究正逐步开展,但相关标准和体系还有待进一步完善,这也是耕地遥感监测需解决的问题之一[35]。

图5 不同类型图像分类结果Fig.5 Classification results of different types of images

依据物候差异和时序特征进行水田的识别,需要结合区域的种植制度和耕作习惯,选择合适时相的遥感影像,比如水稻的移栽期、生长期和收获期,使得水田在遥感影像上的差异最明显,提高水田识别的准确程度。而粤北地区为雨热同期区域,理想的遥感数据(关键物候期,少云或无云影像)是光学遥感影像主要瓶颈。Sentinel 2卫星影像的幅宽为290 km,适用于市域尺度和省域尺度的遥感应用,而结合高分辨率卫星影像,可以提高水田识别的精确程度,但鉴于高分2号卫星的同时相市域和省域尺度覆盖度低,所以本文选择县域作为研究尺度,既能增强数据的可获取性,又能探讨多源遥感提取水田的适用性。

4 结 论

本文利用多源遥感数据,结合研究区晚稻的物候差异,构建时序多特征差异图像,运用随机森林方法,实现粤北地区县域尺度水田的提取。通过提取图像的多种指数特征、纹理特征和物候期图像的差异特征,构建时序多特征差异图像。对比多种图像的分类结果,发现时序多特征差异图像的分类结果最好,提取的水田面积的差异最小,实现了提高水田提取精度的目的。本文使用的方法和数据,同时也适合在云地球上部署,可为云解决方案提供参考。

猜你喜欢
物候水田时序
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
海南橡胶林生态系统净碳交换物候特征
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
你不能把整个春天都搬到冬天来
气候增暖对3种典型落叶乔木物候的影响1)
——以长白山区为例
先锋厦地水田书店
气候变化对民和杏发育期影响分析
《红楼梦》中的“水田衣”是啥