基于FY4遥感数据的森林火灾判别研究

2020-11-03 07:55
中南林业科技大学学报 2020年10期
关键词:火点决策树波段

(中南林业科技大学林学院,湖南 长沙 410004)

卫星遥感是在大时空范围内监测森林火灾最有效的方法[1]。在准确获取森林火灾实时信息的时效性方面,气象卫星远高于高空间分辨率卫星[2]。气象卫星分为极轨气象卫星与静止气象卫星,多系列极轨气象卫星提供的空间覆盖范围大于静止气象卫星,但极轨气象卫星重返周期间隔长,对森林火灾的连续观测能力不足[3]。目前监测森林火灾时间分辨率最高的是静止气象卫星[4],而风云四号卫星(FY4)是我国时效性最高的新一代静止气象卫星。利用FY4 的高时间分辨率特点和第7 波段对热源信息敏感的特性,可快速进行森林火灾判别。目前已经有不少学者研究新一代静止气象卫星,石艳军[5]等分析了新一代静止气象卫星Himawari-8 和FY4 在林火监测的优势,Fatkhuroyan[6]等利用Himawari-8 遥感数据检测印度尼西亚的森林火灾,谢字希[7]利用时空上下文法对Himawari-8 遥感数据进行火点探测研究,本文采用FY4 作为数据源,使用最小距离模型(Min dist)、马氏距离模型(Maha dist)、支持向量机(SVM)、决策树模型(Decision tree)进行森林火灾判别,并利用中国森林防火网森林火灾数据对4 个模型进行精度验证。

1 数据与方法

1.1 研究区概况

贵州省地处中国西南腹地(103°36′~109°35′E、24°37′~29°13′N),全省92.5%的面积为丘陵与山地,是全国唯一没有平原的省份。贵州省属亚热带湿润季风气候,受大气环流和地形的影响,气候多样且极不稳定,灾害性天气频发。贵州省森林面积1 004 万hm2,森林蓄积量4.68亿m3,森林覆盖率达到了57%,根据中国森林防火网2008—2018 统计数据显示贵州省森林火灾年均发生次数为505 起,其中森林火灾最多时一天之内达到54 起,是森林火灾多发省份。

1.2 数据获取与预处理

FY4 遥感数据来自国家气象卫星中心官网(http://www.nsmc.org.cn/),森林火灾验证的数据来自中国森林防火网。30 个云、水体、林地、火点样本,通过风云四号卫星天气应用平台的云图探针统一进行采集,其中火点样本数据由中国森林防火网森林火灾数据提供位置,其它样本通过目视解译进行判读。

FY4 遥感数据经过投影转换将标称投影转化成WGS84 大地坐标,以消除投影偏差[8];经过辐射定标建立数字量化值与辐射亮度值的关系,以消除传感器自身误差;根据FY4 光谱响应数据,经过大气校正消除大气影响,反演出地表反射率[9]。消除误差后将FY4 遥感数据的DN 值转化成比辐射率值,再按照普朗克公式的转化式将FY4 遥感数据的B7~B14 波段的比辐射率值转化为亮温。

1.3 最优波段组合筛选方法

通过对FY4 遥感数据的14 个波段进行火点样本的波段特征、波段间相关系数、波段组合OIF指数计算,分析典型地物光谱曲线,筛选出判别森林火灾最优的波段组合,最后采用支持向量机对所选波段组合进行精度验证[10]。

1)波段间相关系数计算公式如下:

2)OIF 指数是利用波段数据作为波段最优组合选择的数学模型[11],计算公式如下:

式中:Si表示第i个波段的标准差;Rij表示第i、j两波段的相关系数,n表示波段组合个数。

3)利用云图探针采集的样本数据进行典型地物光谱分析,观察波段之间地物的可分离性与火点的光谱特征,进一步筛选最优的波段组合。

4)利用ENVI 软件对OIF 指数排名前10 的波段组合通过支持向量机(SVM)计算其地物的分类精度,验证OIF 指数筛选出的波段组合是否为最优波段组合。

1.4 光谱指数

在进行决策树模型构建时,需要对地物进行判别,从而构建决策树的判别规则。利用不同地物的光谱指数,可有效的进行地物判别。

1)CDI(Cloud detection index)云检测指数,B12 波段反映地表温度,B9 波段反映云层温度,通过B12 和B9 波段的温度差检测出云层,再结合B2 波段地物反射率可进行云检测。地面温度在300 K 左右,云上温度在270 K 以下,云层的B2波段反射率大于0.1,所以云层的CDI 指数小于300[12]。CDI 数值不是一成不变,可以根据地表温度而适当调小,CDI 云指数公式如下:

式中:T12、T9为FY4 的B12,B9 波段亮温,ρ2为B2 波段反射率。

2)NDVI(Normalized difference vegetation index)归一化植被指数,NDVI的取值范围在[-1,1],当NDVI 为负值,地物类型为云、水、雪;当NDVI 为零,地物类型为岩石或裸土,以上数值可以判读为不可能监测到森林火灾;当NDVI 为正值,表示有植被覆盖,且数值越大植被覆盖度越高,林地的NDVI 大于0.3[7],公式如下:

式中:ρ2、ρ3为FY4 的B2,B3 波段反射率。

3)NDWI(Normalized difference water index)归一化水体指数,NDWI 比NDVI 在水体监测上判别精度更高,可以在复杂环境中分离出水体,公式如下:

式中:ρ3、ρ4为FY4 的B3,B4 波段反射率。

1.5 模型构建原理

1.5.1 统计学模型

最小距离模型(Minimum distance 缩写Min dist)是通过训练样本数据计算每一类样本的均值向量和标准差向量,以均值向量作为该类样本在特征空间中的中心位置,判断待检像元到各类样本中心的距离,到哪一类样本中心的距离最小,该像元就归入到哪一类。马氏距离模型(Mahalanobis distance 缩写Maha dist)是待检像元到各训练样本的协方差距离,最终协方差距离最小的,即为此类别[13]。

1.5.2 支持向量机

支持向量机(Support vector machine 缩写SVM)是一种建立在机器学习理论基础上的神经网络模型。其对应的映射函数将样本空间映射至无限维空间,并在这个空间将非线性问题转化为特征空间中的线性可分问题。其实现关键在于核函数,本文采用径向基函数核也被称为高斯核,函数为:可以将样本与样本之间的间隔最大化[14]。

1.5.3 决策树模型

决策树模型(Decision tree)是一种树形结构,在根节点上存放规则,在叶节点上存放判别结果。通过专家经验总结、简单数学统计和归纳方法,获得判别规则,利用对遥感影像数据及其他空间数据规则的输入达到尽可能将判别结果分开的目的[15]。决策树模型最大的特点是可以利用多源数据,难点是判别规则的获取。规则的获取可以来自经验总结,也可以通过统计的方法从样本中计算。

1.6 模型精度评价方法

对于模型精度的评价运用判别精度(D)、多分误差(M)、漏分误差(O),其公式分别为:

式中:yj为实测数,yi为正确预测数、xi为多分数、Zi为漏分数。

2 结果与分析

2.1 最优波段组合筛选

2.1.1 波段统计特征

通过中国森林防火网森林火灾数据提供火点位置,利用风云四号卫星天气应用平台的云图探针对FY4 遥感数据的14 个波段30 个火点样本进行采集,计算得到火点单波段统计特征值(表1)。

由表1可知,火点单波段标准差最大的是B7波段,其次是B8 波段,数值范围B7 波段最大,其次是B8 波段,温度范围最大的是B7 波段,参考官方提供的FY4 遥感数据各波段功能,可以认定B7 波段对于火点反应强烈。

2.1.2 波段相关系数

通过对火点多波段相关系数矩阵统计,如表2所示,可以看出(B7,B8,B12)组合的3 波段相关系数最小。当波段相关系数超过0.9,就可认为两波段间的相关性极高,不需要同时参与波段组合。从表2可以看出有很多波段之间相关系数都超过0.995,波段之间相关性比较大,各波段所包含的信息之间有可能重复出现,为了减少数据的冗余,在进行波段组合时应尽量避开。

2.1.3 OIF 指数

结合波段统计特征与相关系数矩阵以及官方提供的波段功能可知,B7 波段对火点判别作用最大,火点只有排除虚假火点且地物类型为林地才能认定为森林火灾,但所有的森林火灾在遥感影像上都是火点,故在筛选进行森林火灾判别的波段组合时必须要有B7 波段的参与。通过OIF 指数计算有B7 波段参与的3 波段组合,其中OIF 指数排名前10 的波段组合见表3,这些波段组合作为最优波段组合的候选组合。

表1 火点单波段数据统计特征值Table 1 Statistical characteristic values of fire point single band data

表2 火点多波段相关系数矩阵Table 2 Fire point multi-band correlation coefficient matrix

OIF 指数值与波段的标准差呈正相关,与波段间的相关系数呈负相关。波段的标准差越大,组合的相关系数越小,波段包含的信息量就越大[16],波段间的独立性与冗余度就越小,最后计算的OIF值就越大。因此,排除掉候选组合中两波段间相关系数超过0.9 的波段组合,筛选出来的候选波段组合有(B7,B8,B12)、(B7,B9,B12)、(B7,B8,B11)。其中(B7,B8,B12)的OIF指数比排名第二的波段组合要高454.03。

表3 火点样本不同波段组合的OIF 指数Table 3 OIF index of different band combinations of fire point samples

2.1.4 典型地物光谱分析

由于不同地物在FY4 不同波段上呈现的光谱特征不一样,根据判别森林火灾地物类型选取均匀分布的云、水体、林地、火点像元样本各30 个,取均值得到典型地物FY4 光谱反射率与发射率曲线(图1)。

由图1可知,对于地物区分度最好的波段是B7 和B8 波段,尤其是B7 波段对火点的光谱与其他地物区别特别明显。所以排除掉(B7,B9,B12)波段组合,筛选出(B7,B8,B12)与(B7,B8,B11)。由图1可知,B11 和B12 波段的火点与林地的光谱区别很小,说明波段受火点影响很小,可用来描述火点的背景值。自然界的正常温度大致是300 K[17],由于地域和季节时间的不同会有所变化,物体处于此温度时,辐射曲线的峰值波长在10.8 μm 左右,对应FY4 远红外波段B12 波段(表1),外加B12 波段的亮温范围比B11 波段更广,与B7、B8 波段组合的OIF 指数更高,所以判别森林火灾的最优候选波段组合是(B7,B8,B12)。

图1 典型地物的FY4 光谱曲线Fig.1 FY4 spectral curve of typical features

2.1.5 波段组合地物分类验证

利用支持向量机(SVM)分类的方法对OIF指数排名前10的波段组合计算其对云、水体、林地、火点地物的分类精度,验证筛选的波段组合是否为最优波段组合。

通过表4波段组合的支持向量机分类结果可知,(B7,B8,B12)波段组合的精度排名最高,地物分类精度为99.21%,Kappa 系数为0.855,与通过火点样本的波段特征、波段间相关系数、波段组合的OIF 指数,以及典型地物光谱曲线筛选出来最优波段结果一致,故利用FY4 遥感数据判别森林火灾最优的波段组合是(B7,B8,B12)。

2.2 FY4 判别森林火灾的模型构建

4 个模型中最小距离模型、马氏距离模型与支持向量机都是通过对样本数据进行训练,然后通过监督分类的方式获取模型参数的系数,只需要选取训练样本与训练底图就可以得到判别结果。通过最优波段组合筛选得出FY4 遥感数据用于判别森林火灾的最优波段组合为(B7,B8,B12),所以(B7,B8,B12)的波段组合就是这3 个模型的训练底图[18]。将各地物的30 个训练样本与训练底图导入ENVI 软件,即可通过ENVI 软件中的最小距离模型、马氏距离模型、支持向量机得到火点的判别结果。

表4 OIF 排名前10 的波段组合SVM 分类精度值Table 4 OIF ranking top 10 band combination SVM classification accuracy value

决策树模型的判别规则是通过云、水体、林地、火点四类参数进行具体分析,将森林火灾通过层层判断进行筛选。森林火灾判别过程可分为云检测、水体检测、林地检测、火点判别4 个阶段。火点判别又分成3 个阶段,分别为绝对火点判别、时空火点判别与条件火点判别。

对各地物训练样本进行光谱指数研究,得到研究区各地物的CDI 云指数(图2)、NDVI 植被指数(图3)。由CDI 云检测指数、NDVI 植被指数与NDWI 水体指数的地物特征与图1典型地物波段特征可知,CDI 云检测指数小于300 为云,NDVI 小于-0.1 且NDWI 大于0.1 为水体,NDVI大于0.3 为林地。

绝对火点判别与条件火点判别由Giglio 等[1]研究的上下文模型法提供参数系数,时空火点判别的温度演变规律与温度阈值分别来自Calle 等[19]的差分温度阈值法与谢字希[7]的时空上下文法。进行绝对火点判别时,当T7(B7 波段亮温)高于360 K时,表1中B8~B14 波段通道温度已经达到饱和,常态下地物温度达不到这个亮温,这是由地物燃烧引起,因此可以直接判别为火点;进行条件火点判别时,当满足条件:(A 或B)和(C 或D)(A:T12(B12 波段的亮温)大于320 K(夜晚为315 K);B:T7像元值大于影像平均值与4 倍影像标准差之和;C:T7-12大于20 K(夜晚为10 K);D:T7-12的像元值大于影像平均值与4 倍影像标准差之和),根据森林火灾辐射亮温与背景亮温的差异,可判别为火点;进行时空火点判别时,根据地物温度在常态下10~15 min 内只能产生±1.5 K 的变化,当地物的升温变化在5~15 min 内达到5 K以上,且T7-12(B7 与B12 两个波段的亮温差)大于10 K,就可以认为是火点。在发生森林火灾的位置只需检测T7-12大小,就可判断森林火灾状态是否为连续森林火灾,当T7-12小于10 K 时可以判断为森林火灾熄灭。决策树模型如图4所示。

图2 地物的CDI 云指数Fig.2 CDI cloud index of features

图3 地物的NDVI、NDWI 指数Fig.3 NDVI and NDWI indexes of features

图4 决策树模型Fig.4 Decision tree model

图4中,C1(云检测):CDI <300。

C2(水体检测):NDVI <-0.1 和NDWI。

C3(林地检测):NDVI>0.3。

C4(绝对火点判别):T7>330 K(白天360 K)。

C5(时空火点判别):满足ΔT7-72=T7-T72>5和T7-12=T7-T12>10 K(白天15 K)(T72表示前期影像B7 波段亮温,ΔT7-72表示本期影像B7 波段与前期影像B7 波段像元的亮温差。)

C6(条件火点判别):满足条件:(A或B)和(C或D):T12>315 K(夜晚320 K)、B:T7>T7b+4δT7b、C:T7-12>ΔT7-12b+4δT7-12b、D:T7-12=T7-T12>10 K(白天15 K)。(T7b表示背景温度的平均值,δT7b表示标准差,ΔT7-12b表示两个波段差的标准差,δT7-12b表示两个波段差的标准偏差)。

利用模型判别出来的火点还不能称为森林火灾,还需排除虚假火点,这样筛选出来的火点地物类型为林地才能认定为森林火灾。虚假火点包括固定热源、水面反射、云层反射、农用火源等[20]。如果有火点在3 个月内在同一个地方反复出现,可以将其认为是固定热源;水面反射与农用火源造成的虚假火点只需将火点叠加到地表覆盖类型图上,如果火点在水体或农作物种植区域,则为水面反射或农用火源造成的虚假火点[21];云层反射造成的虚假火点需要通过云检测,如果云层与火点重合,则该火点为云层反射所造成的虚假火点[22]。

最小距离模型、支持向量机、马氏距离模型3 个模型是利用训练样本进行火点提取的,需要逐一排除虚假火点发生的情况,且得到的火点地物类型为林地才是森林火灾。而决策树模型在判别规则中就已经对地物进行了区分,排除掉了水面反射、云层反射、农用火源产生的虚假火点,只需再排除固定热源产生的虚假火点,余下的火点都是森林火灾。

2.3 模型精度检验分析

选取2019年2月6 号16 点34 分的贵阳省全省FY4 遥感数据作为实验数据,以2019年2月6号16 点35 分中国森林防火网森林火灾数据作为模型验证数据。4 个模型判别森林火灾的精度通过判别精度、错分误差、漏分误差进行精度评价,精度评价结果如表5。

表5 精度分析Table 5 Precision analysis

2019年2月6 号16 点35 分中国森林防火网贵州省区域的森林火灾一共17 起,通过对比森林火灾的地理位置发现4 个模型的森林火灾监测精度都超过了85%,其中最小距离模型与支持向量机漏检2 起森林火灾,漏分误差为11.76%,马氏距离模型漏检1 起森林火灾,漏分误差为5.88%,决策树模型的森林火灾判别精度最高,17 个验证森林火灾数据全部被判别出来。4 个模型的多分误差都超过了40%,其中决策树模型与支持向量机的多分误差为50%,因为不同传感器判别森林火灾的方法不一样,导致判别的森林火灾结果不一致。决策树模型相比于中国森林防火网森林火灾数据一共多分出了17 起森林火灾,通过目视解译得出这17 个多分出来的森林火灾大部分是微小森林火灾与低温森林火灾,其中17 起森林火灾中有6 起4 个模型都判别为森林火灾。通过叠加分析发现支持向量机与决策树模型对应的森林火灾有27 起,最小距离模型与决策树模型对应的森林火灾有22 起,马氏距离模型与决策树模型对应的森林火灾有26 起。

最小距离模型、支持向量机、马氏距离模型3 种模型需要实时更新训练样本,如果更换区域或者更换新的数据,还需要重新训练,模型的可移植性不强。决策树模型不需要繁杂的样本训练过程,只需要通过经验总结得出模型根节点的判别条件,没有特定的地域限制,可实时的进行森林火灾判别,提高森林火灾监测的时效性。利用决策树模型进行森林火灾判别后,绘制贵州省森林火灾空间分布图(图5)。

3 结论与讨论

3.1 结 论

以贵州省为研究区,利用FY4 遥感数据,计算火点样本的波段特征、波段间相关系数、波段组合的OIF 指数,分析典型地物的光谱曲线,最后通过支持向量机对所选组合进行精度验证,筛选出森林火灾判别的最优波段组合(B7,B8,B12)。通过云、水体、林地、火点各30 样本与最优波段组合构建最小距离模型、马氏距离模型、支持向量机3 种森林火灾判别模型,利用森林火灾判别规则构建决策树模型。以判别精度、多分误差、漏分误差为模型的评价指标,对4 个模型进行精度验证,得到以下结论:

1)最小距离模型、支持向量机、马氏距离模型、决策树模型4 个模型的森林火灾判别精度超过了85%,与谢字希[7]、陈洁等[19]、Jang[23]等研究Himawari-8 遥感数据判别森林火灾的结果是一致的,说明利用FY4 遥感数据进行森林火灾判别是可行的。

图5 贵州省决策树模型森林火灾判别结果Fig.5 Forest fire distinguishing results of decision tree model in Guizhou province

2)本次研究中,4 个模型中决策树模型判别森林火灾的精度最高,判别精度达到了100%。决策树模型不需要繁杂的样本训练过程,只需要通过经验总结得出模型根节点的判别规则,没有特定的地域限制,可大范围实时的进行森林火灾监测。利用决策树模型实现的时空火点判别算法比现阶段单纯的空间维度判别算法更加敏感,可有效解决中小森林火灾监测、高温异常点误报和低温森林火灾监测的问题,极大提高对中小尺度森林火灾和灾害性天气系统的监测能力。

3.2 讨 论

FY4 系列卫星将提供今后20~30 a 的气象观测和环境监测数据,因此利用FY4 遥感数据进行森林火灾判别研究,在监测范围与时效性上,FY4遥感数据一幅影像就可以覆盖全国,每5~10 min就可以扫描一遍;在监测精度上,决策树模型能够满足森林火灾监测要求,可提高森林火灾的实时监测能力,为森林火灾监测提供科学的技术支撑。但模型中云检测的精度和区分森林火灾与动态事件的能力还不够完善,整个森林火灾监测的体系也不够完整。对于下一步可开展以下方面的研究:

1)利用中红外波段和远红外波段完善云检测算法或者通过时空结合算法进行云层的动态检测。其次研究一种完整有效的多时空森林火灾检测算法对表观异常的值进行详细分析,充分发挥FY4遥感数据连续实时监测森林火灾的能力。

2)通过FY4 遥感数据和地面气象站数据,估算地表可燃物含水量变化,再通过降雨、气温,地表水汽蒸发量建立可燃物状态估测模型,为森林草原火险等级做出预报。还可利用FY4 遥感数据监测火点强度、过火区域、烟云等信息,结合森林火灾现场的可燃物分布类型、气象观测资料信息、高分辨率影像与地形数据建立森林火灾蔓延预测模型,为森林火灾预防和扑救提供辅助决策依据。

猜你喜欢
火点决策树波段
最佳波段组合的典型地物信息提取
输电线路周边火灾卫星遥感监测研究与应用
人身上有5个祛火点
利用改进型MODIS火点探测算法实现河北省秸秆焚烧火点识别
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
点烟颂
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
决策树学习的剪枝方法