基于测绘卫星影像的城市不透水面提取

2016-12-27 09:07邵振峰周伟琪
地理空间信息 2016年7期
关键词:不透水决策树纹理

邵振峰,张 源,周伟琪,宋 杨

(1.武汉大学 测绘遥感信息工程国家重点实验室,湖北 武汉 430079;2.测绘遥感信息工程国家重点实验室 深圳研发中心,广东 深圳 518057;3.武汉大学 资源与环境科学学院,湖北 武汉 430079;4.广州市城市规划勘测设计研究院,广东 广州510060)

基于测绘卫星影像的城市不透水面提取

邵振峰1,2,张 源1,周伟琪3,宋 杨4

(1.武汉大学 测绘遥感信息工程国家重点实验室,湖北 武汉 430079;2.测绘遥感信息工程国家重点实验室 深圳研发中心,广东 深圳 518057;3.武汉大学 资源与环境科学学院,湖北 武汉 430079;4.广州市城市规划勘测设计研究院,广东 广州510060)

针对城市大尺度的不透水面提取需求,以高分辨率遥感影像为数据源,基于随机森林模型,对光谱和纹理特征进行重要性分析,选出最优参数,实现高精度城市不透水面提取。选取武汉市作为实验区,以资源3号卫星遥感影像为数据源,不透水面提取的总体精度为0.97,所提取的高精度不透水面可为海绵城市的规划和建设提供有效的专题数据。

不透水面;随机森林;高分辨率遥感;海绵城市

不透水面通常是指水不能渗透的任何物质,且基本上是通过交通和建筑物的建设与人类活动和居住密切相关的[1]。不透水面迅速增加是快速城市化最显著的特征之一。近年来,在城市化进程的快速发展下,地物分布信息变化频繁,郊区透水性较好的土地类型也向透水性差的城市化用地转变,导致以植被覆盖区为主要组成部分的自然景观被人工构建物替代,老城区的工业用地和低密度居住用地被开发为高密度居住用地和商业用地;由此引起了诸如城市热岛效应、非点源污染、大气污染、生物多样性降低等一系列生态、环境和气候问题。不透水面作为评估城市生态环境的主要因素和城市人民生活水平的一个重要指标,被广泛应用于城市土地利用分类、城市人口密度评估、城市规划、城市环境评估、热岛效应分析以及水文过程模拟等研究中。

20世纪70年代以来,通过遥感影像提取不透水面已受到广泛关注。早期不透水面提取主要依靠地面测量和手工数字化方法。该方法虽然精度高,但存在自动化水平低、费时费力、所得数据范围较小等缺点,限制了其应用范围。相比之下,遥感影像因识别信息的波段范围广、监测不受地理位置及环境的限制、具有开阔的视野和瞬态成像的功能、成本低等优势越来越被各领域关注。以往对不透水面的估计和制图的研究多是基于Landsat TM/ETM+等中空间分辨率影像[2-3],然而中空间分辨率影像难以满足城市规划管理和制图需求。高分辨率遥感影像所提供的细节信息更有利于城市管理分析。因此如何从高分辨率遥感影像中快速准确地提取不透水面信息已引起学者的广泛关注[4-5]。

目前国内外在这方面的研究多侧重于应用,利用现有方法进行实验,并对比效果。人工神经网络、决策树和支持向量机等现有机器学习算法已被应用于不透水面提取当中[6],其优势在于分类结果具有高精度,能有效处理高维数据和缓解光谱异质性问题。WU[7]等基于IKONOS影像使用SMA方法评估在高分辨率遥感影像中SMA方法是否适用,并针对高分辨率中产生的混合像元和类内变异增加的问题,提出以内部成员集选择和光谱归一化方法改善提取效果的思路。YANG[8]等基于线性光谱混合分解检测树冠下的植被及高低反照度不透水面等3类地物分量,进一步结合面向对象分类方法提取北京地区QuickBird影像的不透水面信息,该方法将由树冠引起的不透水面低估问题降低了11.2%。LU[9]利用IKONOS影像对比决策树分类和最大似然分类,前者得到更好的分类效果。ZHOU[10]等提出了一种MASC,以多个子模块组合的算法对阴影进行二次分类以提高ISA的提取精度。Robert等利用多尺度分割与面向对象模糊分类方法对Ohio地区的8种土地覆盖类型进行分类,并评估该技术的有效性,结果总体精度达到93.6%[11]。Miller[12]等通过迭代获取训练样本和面向对象的方法,利用特征分析工具获取高分辨率遥感影像光谱空间的上下文关系,对北卡罗来纳州的威克郡土地利用覆盖进行提取分析,其总体精度达92%。在上述机器学习算法中,随机森林作为一个新兴、强大的算法,具有很多潜在的优势,如对噪声鲁棒且可评估变量重要程度等。该算法不仅能很好地捕获非线性关系,还具有很好的并行计算能力[13]。Schneider[14]等基于精度评价指标对随机森林算法、最大似然算法和支持向量机算法进行比较,认为随机森林算法在应对数据缺失时,能达到更好的分类效果。这也是本文选取随机森林算法进行实验的原因之一。但作为一种统计学习算法,它也有其固有的缺点:在样本数据分布不均时,分类结果倾向于样本数目多的类别,造成对其他类别的低估。

本文基于资源3号测绘遥感卫星影像,结合纹理特征和4种光谱指数:土壤调整型植被指数(SAVI)、归一化水体指数(NDWI)、建筑物指数(BAI)和亮度值(Brightness),分析不透水面参数重要性,提取城市高精度不透水面。

1 随机森林模型

Breiman[15]等在2001年提出的随机森林(RF)模型是一种以分类与回归决策树(CART)作为弱分类器组合成的Bagging集成分类器。该模型结合特征重要性选取[16],以Bagging缓解CART对训练集小波动敏感的问题,在处理线性或非线性关系中较好地保持噪声与变量的平衡,具有分类精度高、人工干预少、能对数据提供额外的刻画以及运算快等优势[17]。这使RF算法越来越多地应用于遥感影像分类和建立回归分析模型中[18-19]。

在建立RF模型的过程中,从给定训练集中选取2/3的数据重复采样得到N个bootstrap 数据集,同时将余下的1/3数据作为OOB数据(out-of-bag data)评估预测精度。未修剪的树是独立的bootstrap 数据集通过迭代方式将数据点分到左右两个子集中逐步构造得到,如图1所示。这个分割过程相当于在分割函数的参数空间中寻找最大信息增量意义下最佳参数的过程。其中,需要两个重要的参数:最小叶子数和N个决策树。当模型训练完成,将数据输入模型进行分类预测。对一个输入数据集迭代得根据训练得到的RF中的各个决策树进行判断,直到各决策树的叶节点。在每个叶节点处应用统计学方法,对达到此叶节点的分类标签统计直方图,进而估计此叶节点上的类分布,即最后分类结果通过投票统计获得。

图1 RF模型原理

2 基于RF模型的多特征融合策略

随着空间分辨率的提高,由于城市景观异质性的影响,地物细节特征愈加显著,但也使得类内光谱变异性增强、同物异谱现象明显。地形起伏、高大建筑物和树冠产生的阴影,严重干扰了阴影区域下垫面的光谱;被阴影覆盖的地区可能包含破碎的草地和道路等多种地物类别,也使得地物识别更加困难。并且,高分辨率遥感影像中通常只包含可见光波段和近红外波段[20],仅依靠光谱特征很难应对光谱类内变异问题。为减少同物异谱现象的影响,纹理信息和面向对象的分类方法被广泛应用[21-22]。纹理是指图像色调作为等级函数在空间上的变化,可应用于边缘检测和降低光谱类内变异问题。获取适合纹理信息的关键在于影像的选择、窗口大小和纹理计算方法等[23]。为了提高分类精度,本文选取常用的4个光谱指数和纹理特征作为新波段加入到原影像中进行分类。

2.1 光谱指数

为了提取水体信息,McFeeters[24]于1996年提出NDWI指数。在该指数中,水体表现出较高的数值,其他地物的值接近于0和负值。随后一种改进型的MNDWI指数被提出,用于减缓建筑物与水体的噪声。由于高分辨率影像缺乏中红外波段,本文选取NDWI指数以增强建筑物与水体间的区别。SAVI指数[25]也被广泛用于估算植被信息,同时能增强建筑物与植被间的区别。虽然NDVI指数更适用于大面积的植被估算,但相比之下,SAVI指数由于顾及土壤亮度背景,提取城市之间的植被具有更强大的鲁棒性。BAI指数用于检测沥青、混凝土等人工建筑面,其优势在于即使图像稍有模糊,仍能具备较好的检测效果。由于高分辨率影像中存在阴影问题,Brightness指数被用于区分阴影区域和非阴影区域[26]。

式中,R、G、B和NIR分别表示红、绿、蓝和近红外波段。

2.2 纹理特征

本文使用基于二阶矩阵的纹理滤波[27],即利用灰度共生矩阵计算纹理特征。二阶概率统计用一个灰度空间相关性矩阵来计算纹理值。该矩阵也是一个相对频率矩阵,即统计像元值在两个邻近的由特定的距离和方向分开的处理窗口中的出现频率,表达某个像元和它的特定邻域之间关系。本文中选取均质性和均值作为新的特征加入分类,如表1。

表1 纹理特征计算公式

3 基于RF模型的城市不透水面提取实验

3.1 研究区域与数据预处理

本文选取2012年8月获取的资源3号卫星遥感影像,实验区域覆盖江汉区政府及西北湖附近区域,如图2所示。该区域地物类型丰富,包含水体、裸土、阴影和不透水面(包括道路、建筑物、停车场等人工构建面)等多种下垫面。通过辐射定标将DN值转化为反射率,再作大气校正。以Google Earth 1 m分辨率影像作为参考,选取一定量的样本,将2/3的数据作为训练样本生成RF模型,余下1/3作为验证样本进行精度评定。

3.2 光谱指数和纹理特征计算

采用预处理后的影像计算光谱指数和纹理特征。其中灰度共生矩阵所采用的窗口大小为3×3。图3a~d分别表示SAVI、NDWI、Brightness和BAI,图3e、f为根据近红外波段计算灰度共生矩阵的均值和均质性。

图2 实验区域

图3 光谱指数与纹理特征

3.3 参数优选

为了获取最优的分类结果及平衡时间效率,参数优选是一个重要部分。由图4分析可知,当最小叶子数确定时,决策树个数增多,均方根误差减小;在决策树个数达到18时,误差基本趋于稳定。决策树个数为20时,最小叶子数越大,均方根误差越大。因此,本文通过均方根误差大小,确定最优叶子数、决策树个数分别为5和20。选取光谱指数和纹理特征加入原影像中,对比在最优叶子数下输入特征的重要性,如图5所示。

图4 最优叶子数选择

图5 特征重要性筛选

3.4 分类结果

为了进一步验证RF算法的高精度优势,以ANNs算法和最大似然(ML)算法作比较。图6 a~c分别为RF算法、ANNs算法与ML算法分类结果。在分类结果右上角湖泊中,ANNs算法明显将植被和水体误分为不透水面和阴影;RF算法对水体与阴影也稍有错分;ML算法将裸土与不透水面严重误分。通过计算该地区不透水面面积与总面积之比得到其不透水率为64.71%。

图6 3种方法分类结果对比

3.5 精度评定

本文中采用混淆矩阵来对分类结果进行精度评价,包括总体精度、Kappa系数、生产者精度和用户精度等指标。为了探究特征选择对于精度的影响,本文将原始影像4个波段, 4个光谱指数特征及经过二阶纹理滤波生成的32个特征,共40个特征加入实验,与仅用红外波段生成的均质性、均值2个纹理特征及4 个光谱指数特征,共8个特征进行对比研究。实验发现,在特征数较多时(图7),进行特征选择能够剔除干扰因素进而提高精度;当特征数较少(仅有8 个)时,剔除重要性低的特征对精度影响效果并不明显,甚至有所下降;说明特征选择在一定程度上能提高时间效率,有利于大数据的处理。同时,本文将RF算法与ANNs算法、ML算法精度进行比较,如图 8。RF算法和ANNs算法等机器学习方法从精度上要优于ML算法。RF、ANNs和ML三者总体精度分别为97.06%、92.71%和87.18%。不透水面生产者精度分别为96.34%、94.50%和93.22%。其中,DIS_PA、 LIS_ PA分别表示高反照度和低反照度不透水面的生产者精度指标。

图7 不同特征数下特征选择精度对比

图8 3种方法精度对比

4 结 语

城市化是当代全球变化的重要组成之一。世界上大约有54%的人口居住在城市中,到2050年,这个数字将增加到66%。城市快速扩张也带来了一系列的生态环境问题。本文探索了一种快速有效的不透水面提取方法,并基于RF模型,对光谱指数和纹理特征进行重要性分析,选出最优的参数。对采用资源3号卫星遥感影像提取的武汉市部分区域不透水面进行实验,结果表明该方法具有更高的提取精度。依据该方法提取的城市不透水率,可为准确定位城市建成区透水性的薄弱环节提供技术支撑,为透水性的改造和监测提供有效的数据源,并可为新区海绵城市的规划提供数据支持。

[1] Okujeni A, Linden S V D, Hostert P. Extending the Vegetation–impervious–soil Model Using Simulated EnMAP Data and Machine Learning[J].Remote Sensing of Environment,2015,158(10):69-80

[2] ZHANG L, WENG Q. Annual Dynamics of Impervious Surface in the Pearl River Delta, China, from 1988 to 2013, Using Time Series Landsat Imagery[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2016,113(3):86-96

[3] SONG X P, Sexton J O, HUANG C, et al. Characterizing the Magnitude, Timing and Duration of Urban Growth from Time Series of Landsat-based Estimates of Impervious Cover[J]. Remote Sensing of Environment, 2016,175:1-13

[4] LU D, WENG Q. Extraction of Urban Impervious Surfaces from an IKONOS Image[J].International Journal of Remote Sensing, 2009,30(5):1 297-1 311

[5] XU H. Rule-based Impervious Surface Mapping Using High Spatial Resolution Imagery[J]. International Journal of Remote Sensing, 2013,34(1):27-44

[6] Grinand C, Rakotomalala F, Gond V, et al. Estimating Deforestation in Iropical Humid and Dry Forests in Madagascar from 2000 to 2010 using Multi-date Landsat Satellite Images and the Random Forests Classifier[J]. Remote Sensing of Environment, 2013,139:68-80

[7] WU C. Quantifying High-resolution Impervious Surfaces Using Spectral Mixture Analysis[J]. International Journal of Remote Sensing, 2009,30(11):2 915-2 932

[8] YANG J, LI P. Impervious Surface Extraction in Urban Areas from High Spatial Resolution Imagery Using Linear Spectral Unmixing[J]. Remote Sensing Applications Society & Environment,2015,1:61-71

[9] LU D, Hetrick S, Moran E. Impervious Surface Mapping with Quickbird Imagery[J].International Journal of Remote Sensing,2011,32(9):2 519-2 533

[10] ZHOU Y Y, WANG Y Q. Extraction of Impervious Surface Areas from High Spatial Resolution Imagery by Multiple Agent Segmentation and Classification [J]. Photogrammetric Engineering & Remote Sensing, 2008,74(7):857-868

[11] Frohn R C, Chaudhary N. Multi-scale Image Segmentation and Object-oriented Processing for Land Cover Classification [J]. Geosciences & Remote Sensing, 2008,45(4):377-391

[12] Miller J E, Nelson S A C, Hess G R. An Object Extraction Approach for Impervious Surface Classification with Veryhigh-resolution Imagery[J]. Professional Geographer,2009, 61(2):250-264

[13] Kühnlein M, Appelhans T, Thies B, et al. Improving the Accuracy of Rainfall Rates from Optical Satellite Sensors with Machine Learning: a Random Forests-based Approach Applied to MSG SEVIRI[J]. Remote Sensing of Environment,2014,141:129-143

[14] Schneider A. Monitoring Land Cover Change in Urban and Peri-urban Areas Using Dense Time Stacks of Landsat Satellite Data and a Data Mining Approach [J]. Remote Sensing of Environment, 2012,124:689-704

[15] Breiman L. Random Forests [J]. Machine Learning, 2001, 45(1):5-32

[16] Amit Y, Geman D. Shape Quantization and Recognition with Randomized Trees[J]. Neural Computation, 1997,9(7):1 545-1 588

[17] Fawagreh K, Gaber M M, Elyan E. Random Forests: From Early Developments to Recent Advancements[J]. Systems Science & Control Engineering an Open Access Journal, 2014,2(1):602-609

[18] Akar Ö, Güngör O. Integrating Multiple Texture Methods and NDVI to the Random Forest Cassification Algorithm to Detect Tea and Hazelnut Plantation Areas in Northeast Turkey[J]. International Journal of Remote Sensing, 2015,36(2):442-464

[19] Dye M, Mutanga O, Ismail R. Combining Spectral and Textural Remote Sensing Variables Using Random Forests: Predicting the Age of Pinus Paula Forests in KwaZulu-Natal, South Africa[J]. Journal of Spatial Science, 2012,57(2):193-211

[20] Jungho Im, LU Z Y, Jinyoung Rhee, et al. Impervious Surface Quantification Using a Synthesis of Artificial Immune Networks and Decision/Regression Trees from Multi-sensor Data[J]. Remote Sensing of Environment, 2012,117:102-113

[21] ZHANG Y, ZHANG H, LIN H. Improving the Impervious Surface Estimation with Combined Use of Optical and SAR Remote Sensing Images[J]. Remote Sensing of Environment, 2014,141:155-167

[22] Moran E F. Land Cover Classification in a Complex Urbanrural Landscape with Quickbird Imagery[J]. Photogramm Eng Remote Sensing, 2010,76(10):1 159-1 168

[23] Frohn R C, Chaudhary N. Multi-scale Image Segmentation and Object-oriented Processing for Land Cover Classification[J]. Geosciences & Remote Sensing, 2008,45(4):377-391

[24] Mcfeeters S K. The Use of the Normalized Difference Water Index (NDWI) in the Delineation of Open Water Features[J]. International Journal of Remote Sensing, 1996,17(7):1 425-1 432

[25] Alhammadi M S, Glenn E P. Detecting Date Palm Trees Health and Vegetation Greenness Change on the Eastern Coast of the United Arab Emirates Using SAVI [J]. International Journal of Remote Sensing, 2008,29(6):1 745-1 765

[26] Hsieh Y T, WU S T, LIAO C S, et al. Automatic Extraction of Shadow and Non-shadow Landslide Area from ADS-40 Image by Stratified Classification[C]. 2011 IEEE International Geoscience and Remote Sensing Symposium,Vancouver, 2011

[27] Haralick R M, Shanmugam K, Dinstein I. Textural Features for Image Classification[J]. IEEE Transactions on Systems Man & Cybernetics, 1973,3(6):610-621

P237

B

1672-4623(2016)07-0001-05

10.3969/j.issn.1672-4623.2016.07.001

邵振峰,教授,博士生导师,主要从事城市遥感、智慧城市和海绵城市方面的科研和教学工作。

2016-05-04。

项目来源:中央高校基本科研业务费专项资金资助项目(2042016kf0179、2042016kf1019);国家测绘地理信息局测绘基金资助项目(测科函[2015]19 号);2016年广州市科技计划资助项目(201604020070)。

猜你喜欢
不透水决策树纹理
基于无人机可见光影像与OBIA-RF算法的城市不透水面提取
基于BM3D的复杂纹理区域图像去噪
一种针对不均衡数据集的SVM决策树算法
Landsat8不透水面遥感信息提取方法对比
使用纹理叠加添加艺术画特效
决策树和随机森林方法在管理决策中的应用
TEXTURE ON TEXTURE质地上的纹理
基于决策树的出租车乘客出行目的识别
消除凹凸纹理有妙招!
基于肺癌CT的决策树模型在肺癌诊断中的应用