基于高分辨率无人机遥感影像特征的不同土地利用分类方法对比研究

2022-07-11 08:29俞浩艺
江西测绘 2022年1期
关键词:分类法面向对象决策树

俞浩艺

(江苏省地质测绘院 江苏南京 211100)

1 引言

社会经济发展对土地利用方式产生了较为显著的影响,将无人机高分辨率遥感技术应用到土地利用的分类中,可以有效提升土地规划管理效率,对于宏观土地政策的制定具有一定的借鉴意义[1-2]。

相较于普通载人航空和卫星遥感,无人机遥感技术具有环境适应性强、机动灵活、成本低廉、分辨率高等特点[3],近年来逐渐应用于林业、农业、水土保持、土地利用分类等领域[4-6]。最早的土地利用分类主要是目视解译。随着高分辨率遥感影像的出现,使得目视解译更加容易,但是分辨率越高,光谱信息就越少,使得传统的基于像元层次的分类方法可能就不再适用于高分率遥感影像的特征提取和分类。因此,基于面向对象的影像分类方法就随之产生。目前关于面向对象的土地利用分类方法仍处于初步应用阶段,技术理论相对传统方法还未成熟,其分类效果与其他方法相比具有什么样的优势也没有明确的定论。故本文拟对基于面向对象的两阶段分类法、决策树分类法、支持向量机分类法以及随机深林分类法的土地利用分类情况进行对比分析,以期能为高分辨率无人机遥感影像分类提供借鉴。

2 研究区概况

研究区地貌以丘陵台地、冲积平原为主,地势总体上比较平坦开阔,局部地区略有起伏,属亚热带季风气候,日照充足,雨量充沛,温差振幅小,年平均降雨量为1820 mm,年平均温度22.7 ℃,年平均日照数1874 h。研究区耕地呈小斑块状分布,多以小规模经营方式进行耕作,主要农作物为水稻、香蕉、荔枝、柑橘等,居民用地比较分散。研究区内有一条小河流穿过,并分布有零星的坑塘和沟渠,林地面积较小。研究区高分辨率无人机影像见图1。

图1 研究区高分辨率无人机影像

本次无人机遥感影像主要借助于DB-2 标准型航测无人机,全长2.1 m,翼展2.59 m,最大起飞重量17 kg,巡航速度为100~110 km/h,续航时间3 h,最小起降距离为50 m。航摄仪选用Nikon D800,其最大分辨率为7360×4912。飞行航摄选在天气晴朗、能见度高且无风时进行,航线飞行方向为南北向,飞行高度约1400m。

3 分类方法及技术路线

3.1 土地利用分类方法

(一)决策树分类法

决策树分类法[7]属于数字挖掘方式中常用的一种方法,主要用于无次序、无组序的样本数据的分类。在决策树建立过程中,一般需要确定最小样本量和交叉验证的数量。本文中最小样本数量设置为2,各地物类型的样本数量分别为耕地68、林地35、居住用地48、交通运输用地15、水体9 以及其他用地21;为避免分支过多,导致计算量增大,精度降低,本文交叉验证的数量设置为3。

(二)支持向量机分类法

支持向量机分类法[8]属于统计学理论中的一种机器学习算法,其基于最小风险化的原理,在高纬度的特征空间中寻找最优分类超平面从而得到复杂数据序列中的分类结果,具有适应性强、学习速度快等优点,目前已被广泛应用于遥感数据的智能处理过程中。在支持向量机分类过程中,最重要的就是误差惩罚因子C 的设定和核函数的选型,常用的核函数包括线性核函数、Polynomial 核函数、RBF 核函数以及Sigmoid 核函数。本文根据前人研究经验,将惩罚因子设置为600,在四种核函数中,RBF 核函数表现最为稳定,分类精度最高,故本文选择RBF 核函数作为分类核函数,其gamma 系数设置为0.0001。

(三)随机森林分类法

随机森林分类法[9]是在决策树基础上发展而来的集成分类方法,首先需要从原始样本中随机抽取出多个训练样本子集,然后分别建立与各个样本子集相对应的决策树,得到一个随机森林,最后进行投票表决和分类。该方法具有较强的鲁棒性和学习速度,在分类过程中需要设置两个重要参数:决策树最大个数和生成决策树最大个数,本文中分别设置为60 和5。

(四)基于面向对象的两阶段分类法

基于面向对象的两阶段分类方法[10]主要分为两个分类过程,第一阶段的分类主要是提取影像图中的明显光谱、纹理和几何特征,通过建立四个影像对象层,并逐一建立起继承关系,从而提取得到地物的有效特征;第二阶段的分类主要是对第一阶段中未被有效提取的信息进行再提取,再提取过程采用最邻近分类法,其主要分类过程为:

1)影像分割(本文采用的最优分割尺度为210,形状和紧致度参数取值为0.5);

2)样本选择(本文选择林地、有作物耕地、无作物耕地样本个数分别为10 个、7 个和5 个);

3)构建最优特征空间(空间特征维数为10);

4)分类。

3.2 技术路线

首先利用Agisoft Photo Scan 软件中的SfM 技术将飞行获取的无人机影像进行制作成DOM 数字产品,然后利用ENVI 软件裁剪出目标研究区域,接着对裁剪得到的研究区影像进行特征选取(完成纹理特征和植被指数的选取),再接着将实验区影像进行多特征融合,得到一个既包含纹理特征,又包含5 个波段光谱信息的实验影像数据,然后再进行多尺度的影像分割,并完成地物特征的提取,再分别利用基于面向对象的两阶段分类法、决策树分类法、支持向量机分类法以及随机深林分类方法对研究区土地利用分类情况进行分析,最终得到研究区土地利用分类结果,并对不同分类方法的分类效果进行比较。技术流程见图2。

图2 技术流程图

4 分类结果对比分析

4.1 分类结果图

不同分类方法得到的分类结果见图3。从图中可以看到:决策树分类法能够较好地对林地、耕地进行分类,但对其他用地和居民地的划分较差,特别是中间区域的居民地,有不少被误划分为其他用地。同时该方法划分得到的交通用地和水体也比较差,划分得到的河流出现了几处不连续的地方。相反,支持向量机分类法得到的分类结果较决策树分类法更准确,特别是居民用地和其他用地的分类结果得到有效提升;随机森林分类结果与支持向量机分类法分类结果基本相似,但中间居民区区域会出现其他用地的误判。此外,该方法对交通运输用地的划分不是很准确,左上角停车场未能得到有效识别和分类;值得注意的是,两阶段分类法得到的分类图与实际情况基本一致,对各类地物的分类均较佳,河流也未出现断断续续的情况,左上角交通运输用地的划分也比较清楚。

图3 不同方法分类结果图

4.2 不同地物类别精度对比

不同地物类别在不同分类方法下的分类用户精度和制图精度结果见图4。从用户精度来讲:支持向量机分类法对于耕地和水体的分类用户精度最高,分类精度分别为95.01%和100%,随机森林法对交通运输用地的分类用户精度最高,分类精度分别为100%,两阶段分类法对于林地、居住用地和其他用地的用户分类精度最高,分类精度分别为82.46%、92.16%和81.25%;从制图精度来讲:两阶段分类法对于耕地、林地和交通运输用地的分类制图精度最高,分类精度分别达到95.24%、85.45%和84.21%,支持向量机法对于居住用地和水体的分类制图精度最高,分类精度分别达到90.57%和100%,决策树和随机森林分类法对于其他用地的制图精度最高,分类精度为93.75%。

图4 用户和制图精度对比

4.3 总体精度对比

不同分类方法得到的总体分类精度情况见图5。从图中可以看到,决策树分类法、支持向量机分类法、随机森林分类法以及两阶段分类法的总体分类精度分别为85.27%、89.5%、86.99%和92.16%,Kappa 系数分别为73.24%、80.82%、76.06%以及85.1%,从总体精度和Kappa 系数的表现来看,基于面向对象的两阶段分类法均表现最优,其分类总体精度分别较决策树分类法、支持向量机分类法以及随机森林分类法提高约6.89%、2.66%和5.17%,Kappa 系数分别提高约11.86%、4.28%和9.04%,这是因为基于面向对象两阶段分类法避免了多层次最优分割尺度下的规则分类中出现的大量未被有效提取信息的现象,在利用最邻近分类法进行二次提取后,可以提高无人机高分辨率影像的地物分类精度。

图5 总体分类精度对比

5 结束语

对基于面向对象的两阶段分类法、决策树分类法、支持向量机分类法以及随机深林分类法四种分类方法在高分辨率无人机影像中的土地利用分类情况进行了对比分析,结果表明:基于面向对象的两阶段分类法可以避免在多层次最优分割尺度下的规则分类中出现大量的未被提取的有效信息现象,在进行二次提取后,可以更好地提取得到地物特征,从而提升分类精度和分类效果,因而该方法的分类效果在四种土地分类法中表现最佳,可在高分辨率无人机遥感影像分类工作中予以优先应用。

猜你喜欢
分类法面向对象决策树
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
基于决策树和神经网络的高血压病危险因素研究
分类法在高中化学中的应用
面向对象方法在水蓄冷PLC编程中应用分析
面向对象的组合软件工程研究
决策树和随机森林方法在管理决策中的应用
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别
《中国图书馆分类法》
面向对象的SoS体系结构建模方法及应用