基于OLI数据与决策树法的去山体阴影水体信息提取研究

2017-08-31 13:33张红梅王大卫公维朕
测绘工程 2017年11期
关键词:山体决策树阴影

张红梅,王大卫,高 杨,公维朕

(1.安徽理工大学 地球与环境学院,安徽 淮南 232001; 2.宿州学院 环境与测绘学院, 安徽宿州 234001)

基于OLI数据与决策树法的去山体阴影水体信息提取研究

张红梅1,王大卫1,高 杨2,公维朕1

(1.安徽理工大学 地球与环境学院,安徽 淮南 232001; 2.宿州学院 环境与测绘学院, 安徽宿州 234001)

研究山区地表水体信息OLI遥感数据去阴影自动提取方法,设计基于数字高程模型与指数提取的决策树分类方法,提高水体自动识别的精度。该方法选取改进的归一化水体指数、归一化植被指数、比值植被指数、主成分分析前3个分量以及波段之间的组合运算,并结合DEM构建决策树分类规则。综合采用单波段阈值、谱间关系、植被指数和水体指数阈值完成山体水体的去阴影识别研究,与计算机自动识别分类方法比较,其精度明显提高。结果表明,决策树分类方法在精度上明显高于常用的计算机自动分类方法,可以很好地被利用于OLI遥感数据水体信息的海量、大范围提取。

山区;地表水体;山地阴影;OLI数据;决策树法

水资源与水环境监测与调查是合理规划和有效利用水资源的基础。遥感水体监测技术具有监测范围大、适时性、动态性、周期短、信息量大等优势,在水体信息监测方面发挥着重要作用[1]。利用遥感技术提取水体信息在水资源调查与评价、湿地信息提取、海陆交替地带监测和洪水水情监测等领域被广泛应用。

针对Landsat卫星数据TM和ETM+影像,水体信息提取的方法研究成果较多[2-4]。常用的方法有单波段阈值法、(TM2+TM3)/(TM4+TM5)谱间关系法、植被指数法和水体指数法[5]等方法。单波段阈值法主要利用近红外波段水体与其他地物光谱差异进行阈值确定完成水体提取,阈值确定较难。目前常用的美国陆地资源卫星系列已进入Landsat8星OLI影像数据,OLI数据的山区去山体阴影混淆的水体信息计算机自动识别方法研究,其研究结果对于调节山区水利、促进农业发展、合理排泄灌溉等具有十分重要的意义。

1 试验区介绍

六安市辖3区4县,位于安徽省西部,地处江淮之间,南北长179 km,东西宽176 km,面积约15 490 km2。六安大地构造隶属秦岭褶皱系(东端)和中朝准地台(南缘)两个Ⅰ级构造单元,自南向北为跨武当淮阳隆起、北秦岭褶皱带和华北断坳3个Ⅱ级构造单元,进一步划分为大别山复背斜、佛子岭复向斜、合肥六安凹陷等次级构造单元。

六安市西南高,东北低,由南向北呈阶梯状分布,具山地、丘陵、岗地和平原4个地貌类型。六安市山脉隶属大别山山脉,为长江和淮河分水岭,将全市分为长江与淮河两个流域。境内山脉分为西南段皖山和东段霍山,平均海拔400 m以上。

六安地区地处北亚热带的北缘,属湿润季风气候。其特征是:季风显著,雨量适中;冬冷夏热,四季分明,雨季集中在7~9月份。植被为亚热带常绿阔叶林植被带、皖中落叶与常绿阔叶混交林。六安市辖区有丰富的水资源。辖区内有淠河、史河、杭埠河3大河流,为防洪、工农业生产以及建立良好的生态环境,建国以来,在六安大别山三大河流上游先后修建了著名的梅山、响洪甸、佛子岭、磨子潭及龙河口等几座大型水库。

2 OLI影像数据处理

2013-02-11,继Landsat 计划40后NASA 再次成功发射了 Landsat 8 卫星,该星携带有两个主要传感器:OLI和TIRS。OLI陆地成像仪包括9个波段,空间分辨率为30 m,其中包括一个15 m的全色波段,成像宽幅为185 km×185 km。OLI包括了ETM+传感器所有的波段,调整了OLI Band5(0.845~0.885 um),排除了0.825 um处水汽吸收特征;新增蓝色波段band 1(0.433~0.453 um)和短波红外波段band 9(1.360~1.390 um)。

选取四景OLI影像12238(20151011)、12138(20151002)、12139(20151002)和12237(20151011),统一高斯克吕格北京54坐标系6度分带投影方式,完成影像的大气校正、几何校正、镶嵌、边界切割处理等,完成六安市Landsat8 OLI 7个30 m空间分辨率波段数据的处理。(图1为OLI数据band7、band5和band4波段的RGB假彩色合成影像)。

图1 六安市OLI数据754波段RGB合成图

3 指数提取

遥感卫星数据地表水体的提取方法主要有:目视解译法、单波段阈值法、监督分类与非监督分类法、指数法[6]、谱间关系法等[7]。利用目视解译方法,山体阴影与部分河流及湖泊均为暗黑色(见图2),难以区别,计算机自动分类方法也不理想。研究区湖泊、河流地表水体空间分布分散,目视解译效果不佳。因此选择合适波段,利用水体OLI数据的光谱反射特性,提取地表水体的谱间关系指数[8],建立水体光谱特征模型,确定其阈值,并结合DEM建立决策树分类规则对地表水体信息进行提取[9-10]。

图2 754波段RGB影像山体阴影与水体对比

提取的指数有:归一化植被指数(NDVI,Normalized Difference Vegetable Index)、比值植被指数(RVI,Ratio Vegetation Index)、改进的归一化水体指数(MNDWI,Normalized Difference Water Index),Band3+Band4、Band5+Band7、Band3+Band4+Band5+Band7数据,并选取主成分分析前3个分量和DEM数字高程、坡度数据,共提取相关特征指数11个,与OLI原始数据组合完成决策树分类基础数据库,空间分辨率均为30 m。

其中:NDVI=(NIR-R)/(NIR+R),RVI=NIR/R,MNDWI=(G-SMIR)/(G+SMIR).

式中:NIR,R,G,SMIR分别为Landsat-8卫星OLI数据的近红外band5、红光band4、绿光band3和短波红外波段band7(2.11~2.29 um)。

植物具有在可见光红光波段强吸收,近红外波段高反射的特征,因此利用近红外band5和红光band4组合运算,得到NDVI和RVI指数,利用决策树方法,分类植被与其他地物。NDVI指数对于植被覆盖度低、植被生长状态的监测灵敏;植被覆盖度较高时RVI指数值指示效果较好,并且RVI能有效地区分阴坡植被与山体阴影。徐涵秋在Mcfeeters提出的归一化差异水体指数基础上,提出改进的归一化差异水体指数(MNDWI),可以很好地区分水体和水体阴影,同时达到抑制建筑物和植被覆盖信息的效果[5]。

4 决策树分类

决策树分类方法是基于遥感光谱特征等数据,通过对数据统计、分析、判别,结合专家经验,建立分类指标数据集和决策树分类规则,提取信息的方法。其技术路线为遥感影像处理→特征参数提取和DEM数据获取→标准样区统计→建立规则→分类后处理、精度验证和应用。该方法具有多源数据综合利用、便于理解、易于操作等优点,并且大量研究结果表明该方法分类精度较高[11-12]。分类精度通过目视判读和计算机统计分析相结合的方式进行评价。

实验结果表明:

1)水体和山体阴影在OLIband1至band5和band7波段value值均小于其他覆盖地类。

2)band1至band4波段山体阴影的value值均接近于0,此时与深度和面积较大的水体(面积数十km2,深度50 m以上的六安地区水库)光谱特征与山体阴影较为接近,目视效果也相似(见图2),造成“异物同谱”的现象。

3)OLI数据的band5单波段山体阴影与水体光谱特征相似,但与其他地类差异较大,可以直接利用band5单波段阈值法区分两个类别:第一类为水体和山体阴影,第二类为其他地类(见图3);同时试验得出主成分第一分量对于区分此两类地物效果也较好。

图3 水体、阴影和其他地物OLI数据光谱统计

4)直接利用band1至band4单波段阈值分类水体与山体阴影效果不好,如面积较大、深度较浅的水体(区域北部沟通淮河的瓦埠湖)目视效果与光谱特征与山体阴影差别较大。

5)水体与山体阴影在NDVI,RVI,MNDWI和Band3+Band4+Band5+Band7、band5+Band7、Band3+Band4及DEM坡度数据上均能较好地区分。反复试验建立研究区决策树分层分类规则(见图4)。

图4 OLI数据去山体阴影水体提取决策树

规则1:Band5≧1600 or 主成分1≦929 or Band5+Band71677,决策其他地类,否则执行规则2;

规则2:NDVI<0 or RVI<1 or Band1+Band2+Band3+Band4>Band5,决策为水体,否则运行规则3;

规则3:MNDWI<0 or Band5+Band7>Band2,决策为山体阴影,否则运行规则4;

规则4:高程>500 or slope>15°,决策为山体阴影。部分水库与山体阴影光谱特征相同,各波段value均接近于0,通过DEM高程和坡度决策分类。

5 结果与分析

为了更好地评价决策树分类的精度,选择计算机自动分类的监督分类方法(最大似然法,标准样区与决策树分类法相同)和非监督分类方法(动态聚类法)同时完成该研究区OLI数据的自动识别工作,分类结果部分区域显示见图5、图6和图7,图中蓝色填充部分为水体覆盖,黑色为山体阴影,白色为其他地类;图7红色部分为水体。

图5 决策树分类结果

图6 754波段RGB图和决策树分类结果

图7 动态聚类(左)和最大似然分类(右)

从图6和图7可以看出,由于山体阴影和山区深度较深的水库光谱特征极为相似,仅通过OLI数据原始波段的计算机统计识别,会产生混淆像元,从而很难区分水体和山体阴影的信息。非监督分类将水体和山体阴影直接分类为同一个类别;监督分类仍有将水体分类为阴影或阴影分类为水体的部分。

在91卫图13级影像图上获取水体、山体阴影和其他地类三类地物训练样区276个,对样区特征指数和DEM等数据进行统计后建立决策树分类规则,完成六安市地表水体信息的提取。采用误差混淆矩阵[13]的总体精度和Kappa系数评价分类结果。总体分类精度为被正确分类的像元数和验证总像元数的比值;Kappa系数是评价分类精度的多元统计结果,一般认为其值在0.8~1.0之间,符合分类要求,分类精度较高。研究结果显示:决策树分类总精度为99.36%,Kappa系数为0.983 4,采用同样的标准样区进行最大似然法分类,其总精度为93.91%,Kappa系数为0.857 9。显然决策树分类方法在山体去阴影提取中优于计算机自动识别方法,很好地避免了漏分、误分的现象。

统计六安市面积为15 468.56 km2,其中水体面积为938.78 km2,占区域总面积的6.07%。

6 结 论

1)研究区山体阴影与水体光谱特征比较接近,特别是水库水体部分,与阴影光谱比较一致,目视解译或计算机自动解译很难区分提取。

2)Band5波段和主成分1波段对于区别水体、山体阴影与其他地物,效果明显。

3)NDVI,RVI和MNDWI能很好地区分水体和山体阴影;与山体阴影极为相近的水库水体部分,辅助DEM的高程和坡度建立决策规则。

4)山区山体阴影面积较大,目视判读解译水体,并区分山体阴影很难实现解译工作,必须进行计算机自动识别方法研究。与常规的计算机自动监督分类与非监督分类方法相比较而言,决策树分类方法能很好地提高山区水体提取的精度。从监督分类最大似然法Kappa系数为0.857 9提高到0.983 4。

5)对于山地地区,特别是大范围提取地表水体信息,利用30 m空间分辨率的OLI数据,完全能够满足分类要求。对于研究区域范围内小面积的水体空间位置和面积信息提取,可以从提高数据空间分辨率和像元分解方法方面进行突破。研究中只完成了决策树分类方法与常规分类方法的对比研究,后期仍可以添加决策树决策指标,增加决策数据源或对比其他分类方法进行更深入的研究。

[1] 李纪人. 与时俱进的水利遥感[J]. 水利学报,2016, 47(3):436-442.

[2] 韩忻忆,颉耀文. 基于决策树的干旱区湿地信息自动提取——以疏勒河流域为例[J]. 遥感技术与应用,2015, 30(6):1146-1152.

[3] 王伟武,朱霞,孙跃池,等. 基于ETM图像的山地水体提取方法研究[J]. 系统仿真学报,2013, 25(9):2196-2200,2205.

[4] 杨甲,张珂,刘丽,等. 基于 SPOT-5影像的吴哥地区水体提取方法研究[J]. 测绘工程, 2016, 25(3):51-55.

[5] 徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报,2005(5):589-595.

[6] 李辉,周启刚,焦欢,等. 基于TM影像的重庆市都市区NDVI时空变化特征[J]. 水土保持研究,2015, 22(6):250-255.

[7] 刘晓曼,庄大方,屈冉,等. 基于遥感数据的1989~2009年拉鲁湿地变化研究[J]. 湿地科学,2013, 11(4):433-437.

[8] 王冰,吕昌伟,何江,等. 基于遥感的呼伦湖水体动态监测研究[J]. 环境科学与技术,2012, 35(9):94-98,149.

[9] 余超,李明阳,何隆华. 利用决策树分类方法的南京江宁水稻面积变化研究[J]. 遥感信息,2015, 30(2):80-84.

[10] 张红梅,吴基文,刘星,等. 特征提取和决策树法土地利用遥感分类[J]. 测绘科学,2014, 39(10):53-56.

[11] 宋明明,郑文龙,卞国栋,等. 基于多时相Landsat8数据的南方丘陵区典型地物信息提取——以秦淮河流域为例[J]. 科学技术与工程,2016,16(18):209-216.

[12] 张璇. 基于高光谱遥感的城市水网水体提取研究和实现[D].济南:山东大学,2014.

[13] 李宜展,潘耀忠,朱秀芳,等. 土地覆盖类别面积混淆矩阵校正与回归遥感估算方法对比[J]. 农业工程学报,2013,29(11):115-123,295.

[责任编辑:张德福]

A study of extraction method of mountain surface water based on OLI data and decision tree method

ZHANG Hongmei1, WANG Dawei1, GAO Yang2, GONG Weizhen1

(1.School of Earth and Environment, Anhui University of Science & Technology, Huainan 232001,China; 2. Environment and Surveying Engineering College, Suzhou University, Suzhou 234001,China)

The automatic extraction method of OLI remote sensing data for surface water body in mountainous area is studied. The decision tree classification method based on DEM and index extraction is designed, which improves the accuracy of automatic identification of water body. The improved normalized water index (MNDWI), ratio Vegetation Index (RVI) and normalized difference vegetation index (NDVI) are selected, and the decision tree classification rules are constructed with the digital elevation model (DEM). At the same time, the method of threshold value method, spectrum-photometric method, vegetation index and water index threshold method are used. The research result shows that the decision tree classification method is obviously higher than other methods, which can be used in the extraction of surface water of OLI image data.

mountain; surface water; hillshade; OLI data; decision tree

著录:张红梅,王大卫,高杨,等.基于OLI数据与决策树法的去山体阴影水体信息提取研究[J].测绘工程,2017,26(11):45-48,54.

10.19349/j.cnki.issn1006-7949.2017.11.010

2017-01-02

国家重点研发计划项目子课题(2016YFD0300801);大学生创新创业训练计划项目(201510361124)

张红梅(1982-),女,讲师,博士研究生.

P237

A

1006-7949(2017)11-0045-04

猜你喜欢
山体决策树阴影
你来了,草就没有了阴影
一种针对不均衡数据集的SVM决策树算法
济南市山体修复中的植物应用与技术——以济南市卧虎山山体公园为例
决策树和随机森林方法在管理决策中的应用
让光“驱走”阴影
基于决策树的出租车乘客出行目的识别
阴影魔怪
山体别墅设计分析
基于肺癌CT的决策树模型在肺癌诊断中的应用