基于BOVW和SVM的城市土地类型遥感变化监测研究

2023-05-25 07:33黄靖舒高心丹景维鹏
关键词:土地类型词典分类

黄靖舒,高心丹,景维鹏

(东北林业大学信息与计算机工程学院,林学院,黑龙江 哈尔滨 150040)

城市土地类型变化监测对当前环境变化、可持续发展等热点问题的研究,以及政府决策规划具有重要的意义。使用遥感影像研究城市土地类型变化是一种快速有效的方法。

按照处理信息层次的不同,遥感变化监测可划分为像素级、对象级、场景级监测方法。像素级提出了两种典型的变化监测方法,其一属于传统变化监测法,通过使用差值或比值法生成变化差异图来统计变化的结果。在此过程中会损失许多影像的信息,精度也严重依赖于变化差异图的准确程度。另一种是基于深度学习的变化监测方法,利用自身能够有效、自动、多层次地提取复杂地物抽象特征的优势,用端到端的网络结构处理同源或异源多时相影像数据,获取遥感影像变化监测的结果图。对象级提出了直接对象、分类后、同步分割对象等变化监测方法,较像素级变化方法有更好的监测精度,但其精度严重依赖于影像的分割或分类效果。上述两种方法都只关注了地表状态是否发生变化,忽略了土地利用类型语义场景信息的变化情况。场景级的变化监测是一种应用在语义层次变化分析上的方法,对城市扩张及城市规划方面的研究提供基础。视觉词袋模型(bag of visual words,BOVW)是一种典型的场景级变化监测方法,在变化监测方面不仅能确定地表状态是否发生变化,还能表明场景语义信息的变化情况。通过使用视觉单词来描述图像,有效加入语义信息提供中层次特征表达从而跨越了影像低层次特征和人类高层次概念之间的语义鸿沟[1]。Csurka等[2]提出的BOVW模型通过挖掘未标记样本底层特征上的语义信息,在标记样本和未标记样本之间建立联系,能够有效缓解对大量标记样本进行训练的问题,具有一定的泛化能力。在BOVW模型处理目标图像时提取到的特征点及信息非常多,这其中有部分特征点高度相似。为更好地提高模型性能,将这些高度相似的特征点整合起来,徐培罡等[3]提出融合场景的像素一致性、空间和外观信息,采用K-means算法聚类相似的特征点、量化并统计直方图,进而为变化监测提供中层次场景信息的特征表达,实现高分辨率遥感影像分类。

Landsat系列遥感影像是目前遥感领域遥感数据的重要来源之一,其时间序列长,数据连续性好、质量高。但其分辨率不高的缺点增加了影像分类及变化监测研究的难度,采用BOVW与支持向量机(support vector machine, SVM)结合对城区土地类型进行变化监测,在加入语义场景等重要信息的基础上有效解决了因影像分辨率不高产生的问题。为了验证模型方法的有效性和准确性,本研究选用分辨率为15~30 m的标准数据集进行分类训练和测试,达到较好的精度后,再将哈尔滨市松北区的Landsat遥感影像应用在研究模型上进行土地类型变化监测,以期应用结果辅助了解哈尔滨市城市化进程的情况,对政府的决策、人类活动管理、环境气候情况掌握等活动提供重要的参考信息。

1 遥感影像变化监测模型及构建

分类法[4]、面向对象法[5-8]、时间序列分析法[9-10]、图像融合法[11]等自动及半自动的变化监测方法已广泛应用于土地利用/覆盖变化、森林和植被变化、灾害监测、地理信息更新、目标监视与跟踪、生态环境监测等领域[12-14]。其中,基于视觉词袋模型的场景级变化监测方法是一种能够获取地物统计特征的有效且稳定的特征编码方式,它可以在语义层次上判别土地类型变化情况并提供中层次的特征表达。同时由于SVM是一种效果良好且有坚实理论基础的适用于小样本、非线性学习的分类方法,因此本研究使用BOVW和SVM结合的方法对处理后的遥感数据进行变化监测的研究与分析。具体方法流程如图1所示。

图1 基于BOVW和SVM结合方法的流程示意图Fig. 1 Flow diagram based on the combination method based on BOVW and SVM

1.1 BOVW模型

利用BOVW表示遥感影像分为以下几个步骤:遥感影像的特征提取;对提取到的特征点进行聚类,并将得到的聚类中心作为视觉单词构建视觉词典;通过视觉词典量化遥感图像特征从而表示每张遥感影像,便于后续分类和变化监测工作。

1.1.1 SIFT特征提取

采用尺度不变特征变换算法(scale-invariant feature transform, SIFT)提取Landsat遥感影像局部特征。SIFT算法稳定性好、包含信息多,这种描述方法不仅包括关键点的坐标、尺度和方向信息,还包括其邻域内具有贡献的邻域点[15-16]。有以下3个步骤。

1)尺度空间的生成。目的是通过高斯卷积核实现尺度变换,模拟图像数据的多尺度特征,将一幅二维图像的尺度空间定义为:

L(x,y,δ)=G(x,y,δ)×I(x,y);

(1)

(2)

其中:L(x,y,δ)是图像中某一尺度的空间函数,G(x,y,δ)是尺度可变的高斯函数,I(x,y)为原输入图像,(x,y)是空间坐标,δ是尺度坐标。为了有效地在尺度空间检测到稳定的关键点,利用不同尺度的高斯差分核与图像卷积生成,提出了高斯差分尺度空间:

D(x,y,δ)=(G(x,y,kδ)-G(x,y,δ))×I(x,y)=L(x,y,kδ)-L(x,y,δ)。

(3)

2)监测尺度空间极值点。目的是为了寻找尺度空间的极值点。

3)精确定位极值点。拟合三维二次函数以明确关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点,以增强匹配的稳定性并提高抗噪声能力。

首先,构建空间尺度函数:

对检测到的极值点X0(x0,y0,δ0)对做三元二阶泰勒展开式得到公式(4),空间中每个点表示为向量X(x,y,δ),则D(X)表示为为向量X的空间尺度函数。

(4)

(5)

(6)

主曲率要通过一个2×2的Hessian矩阵H求出:

其次,为每个关键点指定方向参数,即通过关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。

m(x,y)=

θ(x,y)=atan2{L(x,y+1)-L(x,y-1)/[L(x+1,y)-L(x-1,y)]}。

(7)

其中:(x,y)处梯度的模值和方向见公式(7),L的尺度为各个关键点各自所在的尺度。

第三,生成关键点描述子,即将坐标轴旋转为关键点的方向以确保旋转不变性,然后对每个关键点产生128个数据,即形成128维的SIFT特征向量。

1.1.2 构造视觉词典

基于SIFT算法得到的特征点高度相似,所以要对目标图像的特征点及信息进行整合。应用K-means聚类算法将这些特征点聚类形成K个簇,整合这K个聚类中心即特征向量作为视觉词典中的单词(这里K要根据具体情况选定)。由此形成了视觉词典,在视觉词典中的每个单词都包含128维的SIFT特征。则视觉词典(BOVW,式中表示为B)为:

B=(t1,t2,t3,...,ti,...,tk)。

(8)

式中,ti表示视觉单词。使用SIFT算法从每幅图像中提取的特征点都可以用视觉词典中的视觉单词近似代替。遍历整幅图像并通过矢量量化(vector quantization)对底层特征进行编码,对照特征点与视觉词典用视觉单词表示图像的底层特征,统计每个单词在图像中出现的次数形成对应的特征直方图。最终,用频数计数或标记SIFT特征的直方图来表示每张图像。每幅图像P可表示为公式:

P=(f1,f2,f3,...,fi,...,fk)。

(9)

其中,fi为视觉单词ti在图像P中出现的次数。

1.2 基于BOVW和SVM的遥感影像变化监测模型

通过BOVW模型获取遥感图像的特征向量后,需要构建分类器进行遥感图像的分类。传统的遥感影像分类方法主要有两种,一种是基于非监督的图像分类方法,另一种是基于监督的图像分类方法。监督分类算法在解决分类问题中存在许多不足之处,要么仅仅能解决线性问题[17],要么虽能解决非线性问题,但是计算复杂度高[18], 在效率上无法满足要求。为此,近年来多用SVM解决非线性问题[19]。本研究使用的SVM分类器模型是一种有监督的分类模型,它在解决小样本、非线性和高位模式问题中存在优势[20]。SVM解决二分类问题是通过求解最大集合间隔的分离超平面,正确划分训练样本,从而将训练样本点有效分开。W×x+b=0为分离超平面,SVM基本原理如图2所示。

图2 SVM基本原理示意图Fig. 2 The basic principle diagram of SVM

在上述过程中,每幅图像都已表示为用频数计数或标记SIFT特征的直方图,接下来设计并训练分类器,利用图像中视觉单词的分布情况和直方图的统计结果完成对图像的分类。

2 材料与方法

2.1 研究区概况

哈尔滨(125°42′~130°10′E,44°04′~46°40′N)主城区包括松北、道里、道外、南岗、平房、香坊6个地区,周边包括10个县市,主要的土地类型包括城市建筑、水体、植被以及裸地等[21]。

松北区位于哈尔滨城区西部,总面积736.8 km2, 属中温带半湿润大陆性季风气候。该区是哈尔滨市政府的驻地,是哈尔滨市的政治中心。作为大型政区型开发区、国家级“哈尔滨新区”核心承载区,松北区土地类型变化情况明显。近十几年来,由于市政府合理控制二环内建筑及土地类型的变化情况,所以松北区在哈尔滨城市发展与扩张中占比较大并具有一定代表性。因此为了更好地探索模型精度并利用遥感影像研究哈尔滨市土地变化情况,笔者选择松北区的地理区域作为本研究的代表研究区域,其DEM数据如图3所示。

图3 研究区域DEM数据及行政位置示意图Fig. 3 DEM data and administrative location diagram of the study area

2.2 数据集及预处理

数据来源有两种:一种选自NWPU-RESISC45 标准数据集,用于训练验证本研究模型;另一种是Landsat 8遥感影像数据,用于研究哈尔滨市城区土地类型变化情况。NWPU-RESISC45 标准数据集包含了45 个场景类别的31 500张图像,其像素大小为256×256,分辨率为0.2~30 m/像素。实验选用了分辨率接近Landsat 8遥感影像的分辨率为15~30 m的1 000张图像,包含城市建筑及道路、植被、水体、裸地4种土地类型,按7∶3的比例分为训练集和测试集。为避免获取时间季节与位置不同带来的误差,选用了Landsat 8 的遥感影像,拍摄获取时间分别为2013年9月30日与2019年9月15日,条带号为118,行编号为28,宽度和高度为1 292×1 391像素,地物的覆盖类别光谱信息一致,云层覆盖小于0.5。

首先对两个时相的Landsat 8影像进行前期预处理,使用GCS_WGS_1984坐标投影完成配准,有效避免了由位置、传感器、分辨率不同以及云层遮挡等因素带来的干扰和不必要的误差。对融合432波段的多光谱遥感影像进行辐射定标,然后做FLASH(fast line-of-sight atmospheric analysis of spectral hypercubes)大气校正处理,消除了辐射误差反演地物真实的表面反射率。同时,对原始影像的全色波段进行辐射定标处理,统一转换为绝对的辐射亮度。最后融合处理后的全色波段与多光谱影像完成前期处理,得到分辨率为15~30 m的多光谱遥感影像。主要流程如图4所示。

图4 Landsat遥感影像预处理主要流程Fig. 4 The main process of Landsat remote sensing image preprocessing

裁剪预处理后的遥感影像,得到以哈尔滨市松北区为主的两时相遥感影像,如图5所示,其中红色封闭区域部分为实验研究区域。

图5 哈尔滨市松北区Landsat遥感影像Fig. 5 Landsat remote sensing images of Songbei District,Harbin City

实验环境为Windows 10操作系统,CPU为Inter Core i7-6700U,RAM为4 GB。应用Anaconda 3,Tensorflow框架下的Pycharm集成环境,开发语言为Python。

3 结果与分析

应用分类后变化监测,将经过配准的两时相遥感影像进行分类,然后比较分类结果得到变化情况,获取研究区域变化前后的土地覆盖类型、界限以及变化趋势等空间分布情况及其变化的定性、定量信息。

3.1 土地利用分类结果

遥感影像的光谱波段少,类间差异低。在遥感影像中加入纹理特征信息能够有效增加分类依据,提高分类效果[22]。纹理特征信息较为丰富,在灰度模式下可以反映出不同的空间分布特征信息,根据纹理特征对高分影像进行地物分类能够显著提高分类精度[23]。本研究在遥感影像中加入了纹理特征信息,利用彩色的灰度共生矩阵(color gray level cooccurrence matrix, CGLCM)提取图像的纹理信息,将其与原图像结合生成高分辨率多光谱图像作为本研究模型的输入图像。

3.1.1 SIFT特征点提取结果

首先结合纹理信息提取训练和测试集影像的SIFT特征点,即每张图像都用适当的特征表示,构造一个返回N×d维特征的函数,其中N是传递给函数的路径数,d是每个图像表示的维度。加入纹理信息,提取预处理后图像的SIFT特征,监测到包含位置、自身尺度和方向3个信息的所有关键点,对每个关键点产生128个数据信息,形成了128维的SIFT特征向量(图6)。

图6 SIFT特征点提取遥感影像的效果图Fig. 6 SIFT feature points extraction of remote sensing images

3.1.2 模型分类结果及精度比较

1)通过提取训练集数据的SIFT特征,构建合适的视觉词典,然后经过SVM分类器对每个测试图像进行分类,返回一个M×1的字符串数组,其中M是测试用例的数量,每个条目表示1个测试图像的预测类别。视觉词典构建完成后将测试图像输入BOVW进行测试训练,分别选用不同尺寸的视觉词典。最后得到BOVW模型可以进行快速、有效的分类,视觉词典尺寸为550个词汇时,精确度最优,准确率达到79.40%。

2)对研究区影像进行分类。将1 392×1 292的研究区影像裁剪为64×64的380张小图像并记录其坐标位置信息,批处理输入BOVW模型进行分类训练。为验证视觉词典尺寸对图像分类性能的影响,采用交叉验证的方法考察词典尺寸对2 m、15 m两种不同尺度遥感影像分类准确率的影响。结果表明,分辨率较高的影像分类效果相对更好,词典的尺寸并不是越大越好。不同的数据集适合的词典尺寸不同,合适的词典尺寸可以简化系统及更好地保存图像重要信息,而不合适的词典尺寸往往会降低分类准确度。本次实验结果表明,分辨率为2、15 m的遥感影像分类精确度最高时的词典尺寸分别为450和550个视觉词汇(图7)。

图7 视觉词典的尺寸规模对图像分类性能的影响Fig. 7 Influences of the size of visual dictionary on image classification performances

3)为验证模型性能,进行了两组不同遥感分类模型的对比实验。第1组,采用KNN(K-nearest neighbor classification)、支持向量机(SVM)、朴素贝叶斯、随机森林和逻辑回归分类等单一分类算法对实验数据进行分类。第2组,采用“特征提取+分类器”算法对实验数据进行分类,特征提取方法有能够在最小尺度空间表示原始图像的微型图像(tiny images)[24]特征和SIFT特征提取法,分类算法有最近邻(nearest neighbor)和支持向量机(SVM)分类法。使用单一分类算法和“特征提取+分类器”算法的实验结果分别如表1所示。

表1 不同单一分类算法和遥感影像分类准确率比较

采用混淆矩阵表现微型图像和SIFT特征提取方法与最近邻和支持向量机(SVM)分类器组合的分类效果,结果见图8。其横纵轴分别表示4种土地类型的真实类别和预测类别,明亮色块越靠近对角线所在位置的表明分类效果越好。由图8可看出“BOVW+SVM分类”即本研究模型分类准确率相对较高,效果较好。

图8 对比实验混淆矩阵Fig. 8 Confusion matrixes of contrast experiment

3.2 土地利用分类后变化监测结果

利用差值法对影像进行变化监测,结果如图9所示。红色部分为正值变化,蓝色部分为负值变化,白色部分为伪变化区域。由图9可以看出,差值法处理图像存在噪声点多、变化区域分布细碎、变化类别不清晰以及变化区域面积不明确等问题。

图9 研究区遥感影像差值法变化监测效果与遥感影像分类结果及变化监测结果图Fig. 9 Change monitoring effects of remote sensing image difference method, remote sensing image classification results and change monitoring results in the study area

针对上述情况,对利用BOVW模型分类后的遥感影像进行过滤、平滑类边界、移除小孤立区域等处理后,结果如图9B所示。其中各个土地覆盖类型中,城市区包括建筑物和道路,植被包括森林、绿地、耕地和树木,水体包括河流、湖泊和湿地,裸地包括裸土和未利用地。

将经过配准的两时相遥感影像进行分类,比较分类结果得到变化信息,采用随机分层抽样方法评价变化监测结果。除去位于类别边缘无法准确判别其所属类别的采样点,选取了1 000个检验样点,最终得到研究区分类结果总体精度为79.29%。对照2013年与2019年哈尔滨市松北区分类后的遥感影像,选取对应位置类别有变化的区域,按其位置信息进行重新组合,最后确定研究区域两时相影像的土地类型变化情况,得出2013年9月至2019年9月研究区土地类型的变化结果(图9C)。

根据分类结果可得研究区定量面积变化情况如表2所示,其中有下划线数据表示土地类型未发生变化的面积。分析发现,位于哈尔滨市西北部的松北区及其城市周边区域,2013—2019年各种土地类型变化较明显,城市建筑及道路与水体覆盖区域变化最大。对照近年来哈尔滨市政府推出环境保护多个五年规划,以及在总体规划中指出要合理控制城市规模的相关政策[25],本研究结果显示,松北城区范围内城市建筑及道路与植被类型的覆盖面积减少,水体与裸地类型的覆盖面积增加,其中城市建筑及道路和植被的变化率约为52.02%、10.28%,水体与裸地的变化率约为85.33%、37.27%。这主要是由于松北区为“哈尔滨新区”的核心承载区,大力开展了城区各类建设发展,区域开发力度大。

表2 哈尔滨市松北区2013—2019年土地覆盖类型面积变化结果

由《哈尔滨统计年鉴》[26]可知,哈尔滨市2013—2019年城市建筑及道路与植被类型的覆盖面积有所减少,分别减少了21 728、1 933 700 hm2,水体体积与裸地覆盖面积有所增加,分别增加了127.76 m3、194.37 hm2,其中城市建筑及道路和植被的变化率约为48.83%、19.06%,水体与裸地的变化率约为97.82%、38.39%,与本研究4种土地类型变化趋势相同、变化率相近。

4 结 语

随着土地类型变更对城市发展、人类生活以及生态环境的诸多影响,土地类型变化监测技术成为了解城市化进程的重要手段。本研究以哈尔滨市松北区作为研究区域,从建筑、植被、水体和裸地4种土地类型入手研究城区土地类型变化情况。研究发现,松北区城市建筑及道路和植被面积减少、水体与裸地面积(体积)增加,其中建筑及道路和水体变化幅度最大、最明显,这与官方统计数据中的变化趋势基本吻合,可为未来城市建设、发展和政府规划决策提供依据。应用BOVW和SVM的变化监测方法进行哈尔滨城区土地类型变化监测结果表明,在处理分辨率不高、时间跨度长的Landsat遥感影像时,本研究模型能够考虑场景语义信息并有效辨别土地类型的变化情况,且效果良好。

猜你喜欢
土地类型词典分类
小产权房的法律困境与出路
分类算一算
松辽平原西部土壤盐碱化现状调查与转换规律、转换机制
衡邵盆地的干旱时空分布特征及其与土地类型的关系
米沃什词典
分类讨论求坐标
数据分析中的分类讨论
评《现代汉语词典》(第6版)
教你一招:数的分类
县域尺度植被净初级生产力遥感估算及时空变化特征