基于LANDSAT 8 卫星影像的马鞍山市土地利用分类法比较的研究

2024-01-17 08:56
经纬天地 2023年5期
关键词:决策树距离精度

熊 敏

(福建省地质测绘院,福建 福州 350011)

0 引言

随着国家的快速发展,我国各个领域各个行业的发展也是日新月异,对于测绘工程来说,区别于传统的大地测量,遥感技术、GPS 技术、地理信息系统以及摄影测量技术的发展与进步,改变了测绘界一直以来基于传统测量的局面,有效地提高了测量的效率与精度。而其中遥感技术是必不可少的组成部分。本文首先对最初的遥感影像进行预处理操作,然后使用不同的分类方法进行分类,最后评价分析分类的结果,通过这种方法对土地覆盖现状进行调查,有利于我们更好地管理利用土地,减少国土资源的浪费和破坏。

1 研究方法与过程

1.1 研究区的概况

本文研究所选地区为安徽省马鞍山市,位于长江下游长三角区,土地总面积约40.49 万hm2,其中,耕地面积14.79 万hm2,林地面积7.37 万hm2,交通用地0.94 万hm2,水域10.61 万hm2,其他用地6.67 万hm2,市区年平均降水量1060 mm,降水总量约2.9 亿m3。

1.2 数据来源及软件平台

本文所采用的数据下载自官方网站地理空间数据云,行编号与列编号分别为120,38 的某地区Landsat 8 卫星影像数据。Landsat 8 卫星上携带有OLI 和TIRS 两个主要的传感器,本次研究所用数据即由地理空间数据云下载的云量遮挡少、能见度高的卫星影像数据。我们将下载的Landsat 8 卫星影像数据在所选用的软件平台ENVI 4.7 进行初步地裁剪、大气校正辐射定标影像融合等处理后,通过监督分类、非监督分类以及构建决策树的方法对影像数据进行分类比较,分析其分类精度和效果。

1.3 影像数据预处理

本文实验用的影像数据经过筛选后下载,该影像画面清晰,云量较少,图像质量总体较好,以下为预处理操作过程以及原理作简单地介绍。

1.3.1 试验区裁剪

所谓影像裁剪就是裁剪出本次研究所需区域,依据行政区边界或者自身研究所需的区域大小的自然边界进行裁剪,裁剪时可以根据行政区的边界大小使用ArcGIS 软件进行手动抠图裁剪。

1.3.2 影像融合

本文研究所作的图像融合是在基于ENVI 4.7软件系统的支持下将低空间分辨率的多光谱影像和高光谱数据与高空间分辨率的单波段影像重采样生成高分辨率的多光谱影像,使得处理过后的遥感影像在具有高空间分辨率的同时又比单波段影像具有多光谱的特征。

1.3.3 辐射定标

辐射定标,通俗来讲就是把记录的原始的数字量化值DN 转化为大气外层表面反射率或者辐射亮度值等,目的是消除传感器本身产生的误差,从而确保传感器接收的辐射值准确,这也是进行大气校正的前期准备[1]。

1.3.4 大气校正

利用遥感技术获取地物信息时,是用传感器来接收观测目标所发出的电磁能量。大气校正有多种方法和模型,这里我们使用的ENVI 的FLAASH 模块,直接使用atmospheric correction 工具进行大气校正。

2 遥感影像分类方法

2.1 非监督分类

2.1.1 K-Means

K-Means 是非监督的聚类算法,使用的是聚类分析的方法。聚类分析就是在给定的一些数据中查找发现数据与数据之间的关系,并以此为依据将数据进行分组,同组内的对象之间相似度越高、不同组间的差别就越大,那么就代表着该聚类分析的聚类效果越好。

聚类算法时如果希望提高分类精度,可以尝试适当提高迭代次数,分类的操作步骤大致如下:首先打开需要分类的影像数据,在K-Means 分类器的参数设置界面K-Means Paramenters 上我们可以设置分类数目Number of Classes 和最大迭代次数Maximum Iteration,迭代次数越多,分类效果和精度越好[2]。

图1 K-Means 分类图

2.1.2 IsoData

IsoData 中文名称就是重复自组织数据分析技术。IsoData 和K-Means 算法是ENVI 非监督分类的2 种分类器,从算法的角度比较,IsoData 算法是通过选择初始值,包括聚类中心(也称质心)等指标,然后计算数据空间中均匀分布的类均值,按照距离中心的最短距离进行分类,然后用最小距离技术将剩余像元进行迭代聚合,计算出距离函数等指标,重新迭代计算后都计算出一个新的均值,按照给定的要求使用新计算出的各项指标,对之前获得的聚类像元进行合并或分裂处理再分类,从而获得新的聚类中心,聚类中心的个数也会随之改变。

图2 IsoData 分类图

2.2 监督分类

2.2.1 最大似然法

ENVI4.7 软件中的监督分类一共有两类9 种分类器,其中,最大似然法是一种基于传统统计分析学的统计方法,其特点是事先知道地物类别的特征信息,即类别的先验知识。分类的步骤大致如下,首先本文对影像的土地利用分类定义了5 个类别,植被、水体、农田、居民区和道路,在主页窗口中点击Region Of Interest 选择Roi Tool 工具栏定义分类名称和颜色绘制多边形选择训练样本。选择最大似然分类器在参数设置界面根据需要更改参数。

一般默认参数,选择文件输出保存路径后,对影像进行分类显示,经过最大似然分类后的影像结果,如图3 所示。

图3 最大似然分类图

图4 最小距离分类图

图5 决策树分类图

2.2.2 最小距离法

最小距离法(Minimum Distance)属于遥感影像监督分类这个模块,通俗来说,最小距离法就是经过计算影像中所有像元到选取的样本点的距离,统计后进行对比分析,然后根据距离的大小来将其规划进某一类别中。最小距离法的原理大致如下:假设将数据库n分成A、B、C 和D 等几种类别,通过距离算法求出像元到各个类别中心X的距离S,通过比较选择出最小的距离S,将该像元划分到最小距离的类别中。

2.3 决策树

监督分类和非监督分类是比较传统简单的分类方法,随着测绘学科范围不断扩大,遥感技术日新月异快速发展,许多新的分类方法不断诞生,其中决策树分类计数发展较为成熟应用较多。决策树顾名思义是一种树的结构,并且是一个二叉树或者多叉树,树的分叉处是结点包括叶结点和根节点,叶结点表示一个类,根结点是二叉树上面那个结点。本次研究使用决策树分类是基于CART 算法下的,通过CART 算法来获取规则,并基于此规则对影像数据分类[3],以下是基于该算法决策树分类的总体技术流程:

1)数据预处理;

2)构建多源数据。这里需要构建一个混合波段,这个合成波段包括红、绿、蓝和近红4 个波段,NDVI 数据,裁减过后的该试验区DEM 矢量数据以及经过IsoData 分的类数据共7 个波段;

3)获取规则。与监督分类方法相同使用Roi Tool 工具选择选练样本,样本选取后,在Decision Tree 下选择Classifier 计算,得到决策树;

4)在打开的决策树面板点击菜单栏的Options选择execute 执行决策树,得出分类结果。

本次研究使用的决策树分类是基于CART 算法的,但是在ENVI 4.7 软件中需要在网上自行下载CART 插件,安装到ENVI 下。

3 分类结果检验与处理

3.1 精度验证

对遥感数据分类后,需要评价分析分类的结果,判定分类的精度。这是非常重要的一个步骤,精度评价不仅可以判定分类结果的错误率是否对分类结果造成较大影响,而且还能够鉴别每个分类方法的精确度。没有精度说明的分类数据是没有利用价值和使用意义的。对结果进行精度验证最核心和关键的要素就是作为验证样本的数据,该样本数据的来源可以是亲自进行野外调查后得到的数据,也可以从高分辨率的数据源获取。本次实验所用的样本来自Google Earth,主要步骤如下:

1)获取高分辨率的数据样本。

通过Google Earth 软件,将该地区根据之前分类方法中的分类类别,对每种类别选择几处绘制多变形保存。由于Google Earth 上的文件保存类型是Kml 和Kmz 形式,在ENVI 中无法直接打开,因此需要在ArcGIS 中将图层转换为shp 文件。然后将获取的样本数据,加载进ENVI 影像中,通过操作软件将多变形数据转成训练样本。

2)选择分类器进行图像分类。

3)精度验证。在ENVI 主菜单栏Classifiation单击Post Classifiation 选择精度验证方法对分类结果验证,获取精度评价结果。本次精度验证方法选择的是混淆矩阵验证,混淆矩阵的另一个名称是误差矩阵[4]。

表1 IsoData 分类方法精度验证结果

表2 K-Mean 分类精度验证结果

表3 最小距离精度验证结果

表4 最大似然法精度验证结果

表5 决策树精度验证结果

总体分类精度与Kappa 系数的验证结果:

3.2 精度验证结果

通过对每一种的分类结果进行混淆矩阵精度评价后,将Kappa 系数与总分类精度值的数据列出,为了让分类的结果有一个明显对比,同时通过对比表6 中的Kappa 系数值的来确定精度的范围级别。

表6 结果对比

通过对比分析可以得出非监督分类方法IsoData 和K-Means 两种分类方法的Kappa 系数分别为0.34 和0.48,通过对照表7 中的分类精度,IsoData 分类法的分类精度处于一般精度,K-Means分类法的分类精度为良好。对于监督分类,最小距离与最大似然法的总分类精度高于监督分类的两种方法,且最小距离与最大分类方法的Kappa 系数值分别是0.64 和0.66,分类精度较好。相比于前4种分类方法决策树分类法的分类结果显示其总体分类精度和Kappa 系数值明显高于其他4 种分类方法,分类精度较好且高于其他分类法。因此结合精度分类的结果数据对比分析,包括总分类精度和Kappa 系数等,得出对于该地区的土地利用分类方法的选择,决策树分类更加适合。

4 结语

本文以某地区为研究区域,使用ENVI 软件遥感分类方法对该地区的卫星影像数据处理分类,分类方法使用了5 类,得到以下一些结论:

1)利用遥感影像进行实验研究时,需要对原始的遥感影像进行处理,未经处理的遥感影像清晰度和准确度不高,可能会对研究结果造成偏差,因此只有合理地对数据加以处理才能获取较为满意的结果。

2)对特定的地区地物进行分类时,需要大量数据支持,除了研究所需要的地区原始影像,精度验证时使用的标准数据也是非常关键,若是检验数据的精度达不到要求,就无法对以上分类的结果作出准确和权威的精度评价。

3)就本次研究而言,该地区最优的分类方法是基于CART 算法的决策树分类,相较于其他分类方法而言,决策树分类的优势在于根据分类样本生成可被理解的决策树,该算法简单易行,运行的效率较高。

猜你喜欢
决策树距离精度
一种针对不均衡数据集的SVM决策树算法
算距离
决策树和随机森林方法在管理决策中的应用
基于DSPIC33F微处理器的采集精度的提高
基于决策树的出租车乘客出行目的识别
GPS/GLONASS/BDS组合PPP精度分析
每次失败都会距离成功更近一步
爱的距离
基于肺癌CT的决策树模型在肺癌诊断中的应用
改进的Goldschmidt双精度浮点除法器