基于多核极限学习机的遥感影像林地信息提取

2018-07-27 09:18王传立张晓芳文益君
中南林业科技大学学报 2018年9期
关键词:芷江单核学习机

王传立,张晓芳,唐 鼐,袁 梦,文益君,郭 瑞

(中南林业科技大学 计算机与信息工程学院,湖南 长沙 410004)

林地资源是地球宝贵的财富,对人类的生活和发展起着不可或缺的作用;同时,林地资源是森林资源的主要成分,在调节气候、空气净化、产生人类必需的氧气等方面具有重要的作用。但由于我国人口密集,森林往往与居民区交织在一起,传统的林地信息提取方法不方便对林地资源进行二次管理、开发,因而,通过高光谱遥感影像准确高效地识别林地信息有利于更好的管理和开发林地资源。

高光谱遥感技术已广泛的应用于林业、农业[1-4],特别是应用于林业、农业的地物识别,以及林地资源的林地信息提取。特别是,近年来基于机器学习的数据分类方法已取得了显著的效果,众多学者已将机器学习方法成功地应用于高光谱影像的分类。如主成分分析(PCA)[5]、K近邻(KNN)[6]、支持向量机(SVM)[7-8]、极限学习机(ELM)[9]、半监督学习(SSL)[10]、BP神经网络[11]、卷积神经网络(CNN)[12-13]等方法。但是由于高光谱影像波段多,导致影像数据维度高,使得传统机器学习分类模型的训练速度慢、分类精度不高。随着极限学习机理论[14]的提出,因其高效的分类速度,以及良好的分类效果,越来越多的学者开始关注基于极限学习机的高光谱遥感影像分类。

虽然,基于单核的极限学习机[15]在高光谱遥感影像上取得了显著的分类效果。但单核极限学习机只用一个特征矩阵来表达波段信息,因此,有些相似的地物不能够有效的进行区分,造成了该模型的分类精度不能进一步地提升。与此同时,由于高光谱影像样本数量的有限性,用基于大数据的分类方法来提高光谱遥感影像的分类精度,不是非常的切实可行。为了更好地利用高光谱遥感影像提取林地信息,本文以Indian Pines遥感影像和芷江林场遥感影像为数据源,首先利用多核特征提取方法对林地信息进行多核特征提取,从多角度充分表达林地的光谱信息,然后利用多核极限学习机理论[16]在提取得到的多核特征上训练网络分类模型,从而可以方便地利用多核极限学习机分类模型对林地信息进行开发、管理,更好地发挥林地资源的作用。

1 算法原理与分析

1.1 基本极限学习机

极限学习机(ELM)算法对于单隐层神经网络,随机设定神经元的输入权重W和偏置b后,不改变权重和偏置,巧妙的将神经网络训练问题转化为一个最小二乘问题,最后求得问题的解析解,大大缩短了网络的训练时间。本节中相关字母、符号的解释见表1。

对于图1中的单隐层神经网络,假设有n个任意的样本{(Xi,tj)}∈Rn×Rm,对于一个有L个隐层节点的单隐层神经网络可以表示为:

表1 参数含义Table1 Parameter meaning

图1 单隐层神经网络Fig.1 Structure of ELM

单隐层神经网络学习的目标是使得输出的误差最小,可以用公式表示为:

利用最小二乘理论,公式(2)的矩阵表达为:

传统的一些算法用梯度下降法来求解这样的问题,但是基于梯度的学习算法需要在迭代的过程中不断调整所有参数,导致训练的时间过长。而ELM算法,最优网络结构参数可以通过对H求伪逆得到。且可证明求得的解的范数是最小且唯一。

1.2 多核极限学习机

假定n个样本,通过m个核映射函数gi映射得到m个特征表达,βi是对应核函数gi的ELM的输出权重,根据文献[16],多核ELM网络同时优化组合的输出权重矩阵范数和训练误差,多核ELM的优化式子为:

其中,β=[β,β,…,β],是多个核函数融合矩阵的网络输出权重,ξp是第i个样本的训练误差,C为平衡因子,γp是第p个核函数对应的特征表达矩阵的融合系数,yi是第i个样本标签。

显然公式(6)是一个凸优化问题,常用的优化方法为:拉格朗日乘子法,公式(6)的拉格朗日乘子方程为:

其中α和τ是拉格朗日乘子,对公式(7)使用KKT条件,求出MK-ELM最优结构参数α和核融合系数γ为:

其中,K(··γ)表示对多个基核通过融合系数γ融合后的核矩阵,最后得到输出权重βp。

2 高光谱遥感影像分类实验

2.1 高光谱遥感影像数据集

在本节中,用Indian pine高光谱数据集来训练多核极限学习网络模型,验证多核极限学习机(MK-ELM)在高光谱遥感影像分类的有效性。然后用MK-ELM方法对芷江林场遥感影像进行林地信息的提取。Idian pines可以从https://purr.purdue.edu/publications/1947/1下载。芷江林场通过GF-2卫星获得。

Indian pines数据集是公共可用的高光谱数据集,经常用来评估分类算法的性能。Indian pines数据集三分之二是农场,三分之一是林场和湖泊。其高光谱图像有145*145个像素,220个光谱数据带,总共地物有16类,遥感影像的地物实况如图2所示,每一类的样本数见表2。芷江林场遥感影像有747 *512个像素,224个光谱数据带,该遥感影像中主要包括河流或湖泊、马路或桥梁、居民区、农田、森林等5类地物,高光谱遥感数据影像如图3所示,每类样本数见表3。

图2 Indian pines地面实况Fig.2 The ground truth of Indian pines

图3 芷江林场遥感影像Fig.3 The ground truth of Zhijiang forest farm

表2 Indian pines数据集类别信息Table2 Indian pines data set’s category information

表3 芷江林场数据集类别信息Table3 Zhijiang data set’scategory information

2.2 实验和参数设置

为了评估多核极限学习机的性能,使用不同核函数的单核极限学习机(K-ELM)和使用多个核函数的单核极限学习机(MK-ELM)对Indian pines数据集进行对比实验,最后用MK-ELM实现对芷江林场的林业信息提取。

在单核极限学习机中,使用了高斯核(K-ELM rbf)、多项式核(K-ELM poly)、Sigmod核(K-ELM sigmod)3个核函数,其具体的表达式见表4。在单核学习机实验时,高斯核的结构参数取值范围为[0.001,10],平衡因子取值范围为[0.01,1024]。多项式核的结构参数取值范围为[10,1500],平衡因子取值范围为[0.01,1024],并且所有涉及的参数都通过交叉验证方式选取。本文中多核极限学习机采用5个核进行特征表达,具体为:3个高斯核、1个多项式核、1个sigmod核。初始随机选取5个不同的融合系数,进行特征表达,然后通过多核极限学习机理论优化结构参数,确定融合系数。

表4 核函数表达式Table4 Kernel function expression

本文中所有的实验都在Matlab R2016a软件上进行。把Indian pines数据集和芷江林场遥感影像数据集作为输入,随机选取50%的样本作为训练数据,剩下的样本作为测试数据。为了说明分类效果,本研究采取整体正确度(OA)、Kappa系数做性能指标。其中OA指的是测试集合中正确分类的像素百分比,Kappa系数指的是被修正的像素占像素总数的百分比。

2.3 实验结果和分析

采用MK-ELM和K-ELM(rbf)、K-ELM(poly)、K-ELM(sigmod)对Indian pine数据集进行分类,并将结果进行对比分析,结果如表5所示。表5中展示每一类地物的分类精度、整体精度(OA)以及Kappa系数,同时将MK-ELM算法对芷江林场进行林地信息提取,提取的结果如图4所示。

表5 Indian pines数据集分类不同算法比较Table5 Indian pines data set classification algorithmcomparison

图4 芷江林场分类结果Fig.4 Classi fication results of Zhijiang forest farm

从表4中可以看出,在单核极限学习机分类中,对于Corn-mintill、Hay-windwed、Otas、Corn-mintill而言,K-ELM(poly)区分精度明显高于K-ELM(rbf),但对于Soybeans-no till、Stonesteel towers而言,K-ELM(poly)区分精度明显低于K-ELM(rbf)。这表明在单核学习机中,对于核函数的选取很关键。与单核极限学习机K-ELM(rbf)、K-ELM(poly)、K-ELM(sigmod)算法相比,MK-ELM在Alfalfa、Hay-windwed、Woods这几类地物的区分精度明显有所提高,表示MK-ELM对林地信息提取的精度更高,效果好,更适用于林地分类。但Otas、Stone-steel towers的分类精度低于单核学习机,表明MK-ELM不能较好地区分建筑物。单核学习机中分类精度最高的是K-ELM(poly),其整体精度为78.1%,Kappa系数为75%,而MK-ELM的整体精度为80.2%,Kappa系数高达78%。MK-ELM的分类整体精度和Kappa系数相对于单核学习机均有所提高,这表明MK-ELM算法对于遥感影像的分类更优于K-ELM算法。将MK-ELM运用到芷江林场林业信息提取,其分类精度高达89.1%,Kappa高达86%。图4可以很清晰地区分林地、马路或桥梁、农田、河流或湖泊、居民区。对比图3和图4可以发现,MK-ELM对于林地的分类效果很明显,但对于居民区存在错分现象,比如将森林中的土地错分为居民区。

总之,多核极限学习相对于单核学习机,对高光谱遥感影像的整体分类精度明显有所提高,对Alfalfa、Hay-windwed、Woods这几类地物的错分率明显降低对芷江林场的林地信息提取效果优良,能明显地区分林地、农田、居民、桥梁或马路、湖泊或河流。

3 结论与讨论

针对单核极限学习机对高光谱遥感影像特征表达能力不足以及在训练网络时核函数难以选取的问题,本文采取核方法,从不同的特征表达角度,生成了高光谱遥感影像的多核特征。然后借鉴多核极限学习机理论,生成了最优的核特征融合系数以及极限学习机网络结构参数。

对Indian Pines遥感影像分类实验结果表明:单核极限学习机中,最优的是K-ELM(poly),其整体精度为78%,Kappa系数为75%。而MKELM的分类整体精度为80%,Kappa系数高达78%,高于最好的单核极限学习机的效果。并且,MK-ELM 在 Alfalfa,Hay-windwed,Woods这三类地物的区分精度明显有所提高,表明MKELM网络能更好的提取林地信息。用MK-ELM对芷江林场影像进行林地信息提取的实验结果表明:MK-ELM对于林地的分类效果很明显,可以很清晰地区分林地、马路或桥梁、农田、河流或湖泊,林地分类精度高达89.1%,Kappa系数高达86%。

虽然多核极限学习机相对于传统的单核极限学习机在高光谱遥感影像上对林地的区分取得了不错的效果,但该网络模型由于对核融合系数的1范数约束,造成了核系数的稀疏性,也就是有部分核特征并没有被融合,造成了该网络模型对部分特定地物的识别能力不足,比如在芷江林场的林地信息提取实验中,部分居民区被错误地当作林地提取了出来。

另外,在对高光谱遥感影像提取多核特征时,只关注了光谱特征包含的信息,而没有过多的考虑光谱间的相关性,比如地物的纹理特征、结构特征。而这些特征从经验上来看会对林地信息的提取有很大的帮助。在今后的工作中,应充分考虑光谱地物的结构特征重新设计一个非稀疏的多核极限学习机林地信息提取模型。

猜你喜欢
芷江单核学习机
难忘芷江红
芷江行
“机”关
基于随机权重粒子群优化极限学习机的土壤湿度预测
缺血再灌注条件下内皮祖细胞促进单核/巨噬细胞向M1 型极化的研究
朗格汉斯组织细胞增生症的诊治进展
香菇单核菌株菌丝生长特性分析*
平菇原生质体单核化菌株的制备及其培养特征分析
基于改进极限学习机的光谱定量建模方法
芷江受降纪念坊有感(外四首)