特征优选下的GF-6影像土地利用分类方法研究

2022-06-29 05:48张梦茹冯志立
河南科技 2022年11期
关键词:植被指数波段光谱

张梦茹 冯志立

摘 要:考慮多特征组合下的遥感影像分类时,信息量冗余会影响分类精度的问题。本文采用最佳波段指数(OIF)选择最佳波段组合,然后提取纹理和植被指数特征并结合随机森林特征重要性与分类精度之间的线性关系达到特征优选目标:获取最佳特征集合。最后采用随机森林算法、SVM、最大似然算法对实验区进行土地利用分类,对比原始波段、最佳波段组合、全特征集合、优选特征集合分类结果,研究多特征优选下适宜于土地利用分类的最优分类模型。研究结果表明:不同特征集合的分类结果存在一定的差异,在相同的算法下:最大似然算法下原始光谱波段分类精度最高;随机森林算法下优选特征分类精度最高;支持向量算法下全特征集合分类精度最高。在不同算法的特征集合结合中基于随机森林算法的优选特征分类精度最高:总体精度88.07%、F1函数0.843 4、kappa系数0.830 5。因此特征优选下的特征集合结合优势算法在土地利用分类中具有一定的应用价值。

关键词:最佳波段指数;特征优选;随机森林;GF-6

中图分类号:P237      文献标志码:A     文章编号:1003-5168(2022)11-0106-05

DOI:10.19968/j.cnki.hnkj.1003-5168.2022.11.024

Research on GF-6 Image Land Use Classification Method under Feature Optimization

ZHANG Mengru    FENG Zhili

(Key Laboratory of mining space-time information and ecological restoration, Ministry of natural resources,

Jiaozuo 454003,China)

Abstract: When reviewing the classification of remote sensing images under the combination of multiple features, the redundancy of information will affect the classification accuracy. In this paper, the optimal band index (OIF) is used to select the best band combination, and then the texture and vegetation index features are extracted and combined with the linear relationship between random forest feature importance and classification accuracy to achieve the feature optimization goal: obtain the best feature set.  Finally, the random forest algorithm, SVM, and maximum likelihood algorithm are used to classify the land use in the experimental area, and the classification results of the original band, the best band combination, the full feature set, and the optimal feature set are compared, and the method suitable for land use classification under multi-feature optimization is studied. Optimal classification model. The research results show that there is certain differences in the classification results of different feature sets. Under the matching algorithm, the original spectral band classification accuracy is the highest under the maximum likelihood algorithm; the optimal feature classification accuracy is the highest under the random forest algorithm; the full feature set under the support vector algorithm is the highest. The classification accuracy is the highest. In the combination of feature sets of different algorithms, the preferred feature classification accuracy based on random forest algorithm is the highest: the overall accuracy is 88.07%. The F1 function is 0.843 4, and the kappa coefficient is 0.830 5. Therefore, the feature set combination advantage algorithm under feature optimization has definite application value in land use classification.

Keywords: Best Band Index; Feature Optimization; Random Forest; GF-6

0 引言

利用遥感技术获取土地利用分类现状对及时掌握土地利用现状,为管理部门提供数据支持具有重要意义。而采用单一特征结合分类算法实现土地利用分类无法满足精度要求,结合多特征[1]与优势分类算法的土地利用分类可以达到较高精度。但是数据维数的增加导致信息量冗余会间接影响分类精度。因此本文利用GF-6国产数据,通过建立基于特征维数的随机森林特征重要性与分类精度的线性关系,同时采用最佳波段指数OIF,分别实现优选特征集合目标,并对比分析随机森林、最大似然、支持向量机算法在优选特征集合下的分类精度,获取一种能够获得较高分类精度的土地利用分类现状调查方法。

1 研究区及数据源

1.1 研究区

土地利用现状调查对于土地的使用类型的掌握具有一定的价值。郑州市作为河南省省会城市,其土地利用现状及土地规划发展对于城市及周边城市发展起着至关重要的作用。因此本文选择郑州市金水区作为本文实验的研究区。研究区展示如图1所示。

1.2 数据源

本文遥感数据主要采用的是中国资源卫星应用中心(中国资源卫星应用中心(cresda.com))提供的GF6号WFV影像数据。影像信息介绍如表1所示。

2 特征提取与分析

2.1 最佳波段组合选取

为充分利用原始光谱波段特征的信息量,进一步提高原始光谱波段的应用价值,本文采用最佳波段指数对原始光谱波段进行排列组合,以期获取基于原始光谱波段的最佳波段组合,为提高信息量应用价值以及提高分类工作效率,降低劣势光谱波段的向优抑制性。最佳波段指数计算公式如式(1)。

[ OIF=i3Sij3Rij]    (1)

式中:3代表选择的三个波段;[Si]表示所选择波段的标准差;[Rij]表示所选择波段相互之间相关系数的绝对值。计算结果如表2所示。

2.2 纹理特征

纹理特征是一种反映图像同质现象的视觉特征,能够体现出真实地物在影像上的周期变化信息,采用灰度共生矩阵[2]计算影像灰度在方向、间隔、变化幅度与快慢信息,对于地物信息的准确获取具有一定的应用价值。因此本文基于PCA第一主成分影像与灰度共生矩阵计算0°、45°、90°、135°上的方差、对比度、差异性、熵、均值、二阶矩、相关性、同质性等共八个纹理特征,用于构建特征集合,为获取土地利用分类优势特征提供帮助。

2.3 植被指数

植被指数是基于遥感原始光谱数据进行波段运算获得的一些对植被具有一定指示的数值。因此为更好地利用遥感原始光谱波段数据,达到更好的土地利用分类结果。本文选择几种较为常用的植被指数用于增加特征集合维数:增强型植被指数[3](Enhanced Vegetation Index,EVI),超绿指数(Excess Green,EXG)、归一化绿红差异指数(Normalized Green Red Difference Index,NGRDI)以及可见光波段差异植被指数[4](Visible band Difference Vegetation Index,VDVI),修正型归一化植被指数[5](Modified Normalized Difference Vegetation Index,MNDVI),归一化水体指数(Nomalized Difference Water Index,NDWI)、改进阴影水体指数[6](Modified Shadow Water Index,MSWI),比值居民地指数[7](the Ratio of Residential Area Index,RRI)、归一化植被指数[8](Normalized Difference Vegetation Index,NDVI)、比值植被指数[9](Ratio Vegetation Index,RVI)。

2.4 优选特征集合选取

在采用多特征集合进行土地利用分类时,算法的强大与特征集合的维度是影响最终结果的关键。算法适应性较差、特征维度较高则分类结果在一定程度上无法满足需要。而随机森林算法中的特征重要性计算方法可以根据各特征在分类中的贡献程度将不同特征的分类重要性进行表达。因此,基于python平台编写随机森林算法特征重要性计算程序,计算该算法每一个特征的贡献率,并基于ENVI软件绘制特征重要性排序图与分类精度变化图。最终结合分析获得优选特征集合。

结合特征重要性排序结果(图2)与精度变化趋势图(图3)可以看出:当选择前两个特征时相较于其他特征集合分类精度达到最高。因此本文优选特征集合由B16与B12组成。具體特征描述如表3所示。

3 方法选择

为突出算法及特征组合在土地利用分类中结合的优势,本小节采用多特征组合的方式分别构建基于最大似然算法(Maximum Likelihood Classification Algorithm,MLC)、随机森林算法(Random Forest Algorithm,RF)、支持向量机算法(Support Vector Machine Algorithm,SVM)的OIF特征、原始光谱特征、优选特征、全特征的分类模型对研究区进行土地利用现状分类。其中特征集合对应特征个数为3、6、2、48。分类使用样本为基于GF-2研究区影像像元,根据研究区实际地物类型并结合《土地利用分类标准》(GB/T 2010—2017)采集样本:城镇建设用地133、耕地14、裸地25、水域89、植被103,按照7∶3将样本分为训练集与测试集。获取不同模型下分类结果如图4、图5、图6所示。

根据上述分类图对比未分类图像进行直观定性分析可知:①在最大似然方法中OIF特征集合将大面积城镇建设用地误分为水域或者是裸地;原始光谱特征集合将少量水域误分为城镇建设用地,同时将少量城镇建设用地误分为裸地;优选特征集合将大面积城镇建设用地误分为裸地;在全特征集合中由于随着波段维数的增加,研究区某地类存在面积较小无法获取较多样本从而导致算法无法正常运行。综合可知该算法在与特征集合结合的方式下对土地利用现状进行分类获取时存在一定的缺陷性。②在随机森林算法中OIF特征集合分类结果整体较好,但出现少量城镇建设用地误分为水域的现象;原始光谱特征集合表现与OIF特征集合相似,区别在于将耕地分为植被,原因主要是样本比例由于研究区地类所占面积较小导致的失衡;优选特征相同上述两种特征集合但在其他类别的分类中与未分类图基本一致;全特征集合能够达到与优选特征集合基本相同的结果,但是在对个别地类分类的过程中出现未分类现象。③在支持向量机算法中全特征集合相比于其他特征集合的分类结果除去较小偏差基本与未分类图地物类别分布一致,而其他特征集合出现较多的误分现象。为进一步定量分析不同模型在土地利用现状分类中的应用价值,选取总体精度(Overall accuracy,OA)、F1函数、kappa系数对分类结果进行数值分析。计算结果如表4所示。

结合精度指标可以看出:不同的分类算法结合不同的特征集合会产生不同的分类结果。在相同的特征集合下,整体上随机森林算法所达到的精度较高。在相同的分类算法下,最大似然算法结合原始光谱特征集合的精度可以达到80%以上;随机森林算法结合优选特征的精度最高:总体精度88.07%、F1函数0.843 4、kappa系数0.830 5;支持向量机算法集合全特征集合的精度最高:总体精度87.16%、F1函数0.833 3、kappa系数0.813 6。

综合上述定性与定量分析结果可以得出基于GF-6影像的随机森林算法结合优选特征集合对研究区土地利用现状进行分类获取能够得到较好的结果。

4 结论

掌握土地利用现状对土地管理具有重要作用,在土地利用现状调查中为提高分类精度而促使基于遥感技术的多特征组合方式多被使用,但是多特征组合的使用导致信息量的冗余从而降低分类精度。因此本文考虑多特征组合下的遥感影像分类时,信息量冗余会影响分类精度的问题,采用国产GF6号WFV影像数据,提取植被指数、纹理特征构建多特征集合,并结合最佳指数OIF与随机森林特征重要性计算方法优选特征,最终选取最大似然、随机森林、支持向量机算法对比不同特征集合下的分类精度。结果表明:基于随机森林算法的优选特征集合对土地利用现状分类的精度最高为总体精度88.07%、F1函数0.843 4、kappa系数0.830 5。因此,特征优选下的优势算法结合对土地利用分类现状的分类具有一定的应用价值。

参考文献:

[1] 王宏胜,李永树,张天棋,等.融合多特征的村域无人机影像两阶段土地利用分类方法[J].测绘与空间地理信息,2022,45(3):44-49.

[2] 冯子恒,宋莉,张少华,等.基于无人机多光谱和热红外影像信息融合的小麦白粉病监测[J].中国农业科学,2022,55(5):890-906.

[3] 王敏钰,罗毅,张正阳,等.植被物候参数遥感提取与验证方法研究进展[J].遥感学报,2022,26(3):431-455.

[4] 张雅琼,赵宇昕,屈冉,等.基于GF-1卫星遥感影像的生态空间周边建筑余泥渣土场提取方法研究[J].环境保护科学,2018,44(6):50-55,89.

[5] 赵庆展,江萍,王学文,等.基于无人机高光谱遥感影像的防护林树种分类[J].农业机械学报,2021,52(11):190-199.

[6] 龚文峰,王鹏,王双宇,等.基于GF-2卫星遥感影像的界河水体信息提取方法[J].黑龙江大学工程学报,2018,9(4):1-7.

[7] 唐璎,刘正军,杨树文.基于三指数合成影像的西北地区城市建筑用地遥感信息提取研究[J].地球信息科學学报,2019,21(9):1455-1466.

[8] DIHKAN M, GUNEROGLU N, KARSLI F, et al. Remote sensing of tea plantations using an SVM classifier and pattern-based accuracy assessment technique[J].International Journal of Remote Sensing, 2013,34(23):8549-8565.

[9] 奚雪,赵庚星,高鹏,等.基于Sentinel卫星及无人机多光谱的滨海冬小麦种植区土壤盐分反演研究:以黄三角垦利区为例[J].中国农业科学,2020,53(24):5005-5016.

猜你喜欢
植被指数波段光谱
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
郭守敬望远镜获取光谱数破千万
卫星电视常用接收方式及SDTVplus在卫星接收中的应用
利用小波分析对岩石图像分类
浅析光谱技术在200 nm以上和以下尺度范围内的不同
浅谈植被指数的分类与应用
分集技术在Ka波段抗雨衰中的应用