基于PCA的高光谱遥感图像分类

2017-12-13 01:56宋海峰陈广胜杨巍巍
测绘工程 2017年12期
关键词:波段正确率光谱

宋海峰 ,陈广胜 ,杨巍巍

(1.东北林业大学 信息与计算机工程学院,黑龙江 哈尔滨 150040;2.黑龙江工程学院 计算机科学与技术学院,黑龙江 哈尔滨 150050;3.哈尔滨工程大学 计算机科学与技术学院,黑龙江 哈尔滨 150001)

引用著录:宋海峰,陈广胜,杨巍巍.基于PCA的高光谱遥感图像分类[J].测绘工程,2017,26(12):17-20,26.

DOI:10.19349/j.cnki.issn1006-7949.2017.12.003

基于PCA的高光谱遥感图像分类

宋海峰1,2,陈广胜1,杨巍巍2,3

(1.东北林业大学 信息与计算机工程学院,黑龙江 哈尔滨 150040;2.黑龙江工程学院 计算机科学与技术学院,黑龙江 哈尔滨 150050;3.哈尔滨工程大学 计算机科学与技术学院,黑龙江 哈尔滨 150001)

高光谱遥感图像的出现进一步提升遥感图像分类的准确性,但高光谱遥感图像的数据量大,处理高光谱遥感图像复杂度高、效率低。为解决这一问题,将主成分分析算法作为遥感图像分类的预处理技术。分析主成分分析算法的原理,利用主成分分析算法提取高光谱图像的主要波段图像。通过实验验证得出结论:高光谱遥感图像的主波段图像包含分类所需的大部分信息,利用少数的主波段图像即可达到70%以上的分类正确率。实验结果表明,在保证分类正确率的前提下,PCA算法可有效地减少图像分类处理的数据量,提高图像的处理效率。

高光谱;遥感图像;主成分分析;图像分类

光谱分辨率是高光谱遥感图像的重要指标参数,利用光谱分辨率可以确定待分类图像的光谱特征[1]。光谱分辨率是指单幅图像的光谱范围,高光谱图像的光谱范围一般在5~10 nm[2-3],这几乎是以连续的光谱信息来记录地物影像。高光谱遥感图像为图像处理带来新的机遇的同时也带来了问题:一方面,与传统的多光谱遥感图像处理不同,高光谱遥感图像不仅能够区别不同类别的地物,而且能够给出不同地物的具体属性,比如矿物质、土地、植被等;另一方面,处理不同波段的图像时带来了困难,显著增加了图像处理的时间和空间复杂度。根据休斯效应(Hughes):高光谱遥感图像分类的正确率会随着光谱波段数的增加而降低[4-5]。因此,如何有效减少数据量,或者从全部数据集中选出与特定应用相关的波段图像成为了目前高光谱遥感图像处理的主要工作。本文首先利用PCA(Principles Components Algorithm)算法计算出可用于图像分类的最佳波段,然后分析这些最佳波段图像的特征,最后验证利用PCA主波段图像分类所得的正确率。实验证明PCA算法在保证分类正确率的前提下,可有效提高高光谱图像的分类效率,降低分类复杂度。

1 PCA原理

主成分分析算法认为高光谱图像的相邻波段之间存在着高度的相关性,并且对高光谱图像中的相同地物以相同的信息进行描述[6]。PCA变换通常是将原始图像进行变换,从而达到去除波段图像之间相关性的目的。在这个过程中,根据波段图像像素值的变化来确定原始图像的优化线性组合方式。

PCA算法利用高光谱波段间的统计特性分析其相关性。PCA算法的计算过程下[7-9]:

将用图像像素组成的向量表示如下:

(1)

式中:x1,x2,…,xN为高光谱图像中每一个像素点的对应值。图像向量的维数为高光谱图像的波段数N,对于一个m行n列的高光谱图像一共有M=m×n个向量,i=1,2,…,M,所有波段图像的均值可表示为

(2)

其中,x的协方差矩阵,

Cov(x)=E[(x-E(x))(x-E(x))T].

(3)

式中:E为期望运算,T为转置运算,Cov为协方差运算。

同时可通过下式近似计算得到协方差矩阵:

(4)

对协方差矩阵进行特征值分解:

Cx=ADAT.

(5)

其中:

D=diag(λ1,λ2,…,λN).

(6)

式中:D是由协方差矩阵Cx的特征值λ1,λ2,…,λN所构成的对角阵。A是由协方差矩阵Cx的特征值λ1,λ2,…,λN对应的特征向量所构成的正交向量:

A=(a1,a2,…,aN).

(7)

原始波段图像线性变换:

yi=ATxi,(i=1,2,…,M).

(8)

所得yi即为原始图像xi的PCA变换图像,由所有原始图像x变换所得y即为原始高光谱图像的PCA变换图像。

对特征值和特征向量降序排序:

λ1≥λ2≥…≥λN,

(9)

计算得到的PCA波段图像中,第一个波段图像具有最大的对比度和方差,最后一个波段图像具有最小的对比度和方差。因此,前k个PCA波段图像通常包含了原始图像的主要信息,由于图像的波段数和噪声明显减少,因此用k个PCA波段图像来代替原始图像进行分析计算效率将会更高。

PCA算法的几何表示法如图1所示,原始图像由band1和band2两个波段所构成,两个波段之间存在很大的相关性。PCA变换的特性:①可以有效的消除band1和band2之间的相关性;②PCA波段1描述了图像中最大的变化,PCA波段2表述的是图像中第二大的变化,在最初的几个PCA波段都符合这一变化趋势中,其余的PCA波段则包含着越来越少的有用信息。

图1 主成分分析和PCA波段的几何表示

2 基于PCA波段图像内容实验分析

基于PCA波段图像内容进行实验分析。实验数据采用黑龙江省伊春市凉水林场数据集,该数据集是2012年7—8月间由B5飞机拍摄于黑龙江省伊春市带岭区凉水林场地区,该数据集一共有144个波段,空间分辨率为1.5 m,光谱覆盖范围为371~1 051 nm,图像大小为1 025像素×767像素,该数据集的地面实况标记了 5 类地物(针叶林、阔叶林、草地,水域,房屋)。

计算原始144个PCA波段图像,图2为原始图像,图3为PCA波段图像。如图3所示,高光谱遥感图像的主要信息都包含在前几个PCA波段图像中,其余的波段图像基本都是噪声。从图中可以看出前5个PCA波段图像几乎包含了所有的信息;PCA波段6至PCA波段10图像,只能区分对比度相对比较大的区域;PCA波段10以后的图像基本都是噪声。本实验也验证了休斯效应,即随着PCA波段的增多,PCA波段图像所包含的有用信息逐渐减少。

图2 原始高光谱图像

图3 PCA波段图像样例

Mather[10]也开展了相似的实验,并且对PCA波段图像进行了定量的描述,实验结果表明,对应较小特征值的PCA波段图像包含了较多的信息,这些信息实际上可以用来对图像进行分类。Mather[10]指出不能仅依靠特征值对应的PCA波段图像来做图像分类,还应考虑图像的实际视觉效果。

3 基于PCA的高光谱遥感图像分类

高光谱图像通常对给定地物的属性进行详细分析。从理论上讲,PCA变换会影像高光谱图像的分类结果。对高光谱遥感图像的PCA波段和原始波段进行对比分类,通过PCA算法获得原始图像的PCA波段图像,选择分类训练的区域,这些区域均已被标记了已知的属性信息,最后通过K-means法对图像进行分类。

首先对原始图像、全部PCA波段图像和PCA波段图像的子集进行分类,分类结果如图4所示。从分类的视觉效果看,原始图像和全部PCA波段图像的分类结果基本一致。

图4 分类结果对比

以原始图像的分类结果为参照,对比PCA变换的分类效果。对两种分类结果的对应像素做差即可得到差分图像,通过差分图像可以得到被正确分类和错误分类的像素点以及分类的正确率。从表1可以看出,随着参与分类的PCA波段图像的增多,分类的正确率上升的非常缓慢。对于实验数据集,当使用10%的PCA波段图像时可以得到70%左右的分类正确率;当使用20%的PCA波段图像时可以得到75%~80%左右的分类正确率;随着PCA波段图像数的增加,分类的正确率缓慢提高,当使用50%的PCA波段图像时可以得到90%左右的分类正确率。因此,可以看出PCA方法具有很好的实用性,只需从原始大量的数据集中提取较少的PCA波段图像即可得到理想的分类结果。

从分类的结果还可以看出,被错误分类的像素点主要集中在图像边缘部分。这是由于在进行PCA变换时图像边缘部分的信息丢失所造成的,这些错误分类点会影像整体的分类精度。但是,错误分类点并没有改变整个图像的分类模式,因此主要的分类结果仍然正确。

表1列出了对高光谱图像进行PCA变换所用的时间,分类总时间等于PCA变换时间与分类时间之和。采用实验数据集的PCA变换时间为20 s,当分类的对象是原始数据集时,由于无需进行PCA变换,因此分类总时间等于分类时间。如表1所示,当使用较少的PCA波段图像进行分类时,分类所用时间明显减少,当使用前5个PCA波段图像进行分类时,分类所用时间为7 s,占分类总时间的25%。实验结果表明,在实际应用中虽然PCA变换占据了大部分的分类总时间(约占分类总时间的34%),但总的分类时间仍然小于利用原始图像进行分类的总时间。

表1 分类正确率和分类时间统计表

4 结 论

本文的研究表明:PCA算法是一种实用的高光谱遥感图像分类的预处理技术。具体可得出以下结论:

1)对原始高光谱图像进行PCA变换之后,图像中有用信息大多包含在前5%~10%的PCA波段图像之中,前10%以后的PCA波段图像基本为噪声。

2)应用较少的PCA波段图像对高光谱图像进行分类所得的结果与应用全部原始高光谱图像进行分类所得的结果基本一致。

3)随着参与分类的PCA波段图像的增多,分类正确率提高的非常缓慢。以上结论表明,使用PCA算法对高光谱图像进行分类,可有效地提高分类效率;在保证分类正确率的前提下,PCA算法可减少数据量;因此PCA算法是一种有效的高光谱遥感图像分类的预处理算法。

[1] 杨凯歌,冯学智,肖鹏峰,等. 优化子空间SVM集成的高光谱图像分类[J]. 遥感学报,2016,20(3):409-419.

[2] 刘良春,冯燕. 结合纯像元提取和ICA的高光谱降维方法[J]. 计算机应用研究,2011,28(3):1689-1699.

[3] DABHADE S B, BANSOD N S, RODE Y S,et al. Hyper spectral face image based biometric recognition[C]. Proceedings - International Conference on Global Trends in Signal Processing, Information Computing and Communication, ICGTSPICC 2016, 2017: 559-561.

[4] HUGHES G F.On the Mean Accuracy of Statistical Pattern Recognizers[J]. IEEE Trans on Information Theory 1968, 14(1):55-63.

[5] SHAHSHAHANI B M,LANDGREBE D A.The Effect of Unlabeled Samples in Reducing the Small Sample Size Problem and Mitigating the Hughes Phenomenon[J]. IEEE Transactions on Geoscience & Remote Sensing, 1994, 32(5):1087-1095.

[6] KOONSANIT K, JARUSKULCHAI C,EIUMNOH A.Band Selection for Dimension Reduction in Hyper Spectral Image Using Integrated Information Gain and Principal Components Analysis Technique[J]. Physical Review B, 2012, 3(3):248-251

[7] SCHOWENGERDT R A. Remote Sensing: Models and Methods for Image Processing. Beijing: Publishing House of Electronics Industry, 2010.

[8] GONZALEZ R,WOODS R.Digital image processing. New Jersey: Prentice Hall, 2002.

[9] HAIFENG S, GUANGSHENG C, HAIRONG W,et al.The improved (2D)2PCA algorithm and its parallel implementation based on image block[J]. Microprocess. Microsyst., 2016, 47(PA):170-177.

[10] MATHER P M.Computer processing of remotely-sensed images. New York: John Wiley & Sons, 1999.

[责任编辑:李铭娜]

Principalcomponentanalysisforhyperspectralimageclassification

SONG Haifeng1,3,CHEN Guangsheng1,YANG Weiwei2,3

(1.College of Information and Computer, Northeast Forestry University, Harbin 150040,China; 2.Computer Science and Technology, Heilongjiang Institute of Technology, Heilongjiang Harbin 150050,China; 3.Computer Science and Technology, Harbin Engineering University, Harbin 150001,China)

The availability of hyper spectral images enhances the accuracy of remote sensing image classification, but the problem is the high time complexity and low execution efficiency when processing the hyper spectral image, because of the huge data of hyper spectral image. In order to solve the problems, this work uses the principal component analysis algorithm as the preprocessing technique for the classification of hyper spectral images. First, the principle of principal component analysis algorithm is analyzed. Second, the principal component analysis algorithm is used to extract the principal component image bands of hyper spectral images. A brief presentation of the principal component analysis approach is followed by an examination, which reveals that the principal component image bands contain significant information. The use of the first few principal component images can yield about 70 percent correct classification rate. This study suggests that with the premise of ensuring classification accuracy, the amount of data for the classification of hyper spectral images can be reduced effectively and the execution efficiency can be improved.

hyper spectral; remote sensor images; principal component analysis; image classification

P231

A

1006-7949(2017)12-0017-04

2017-02-04

黑龙江省自然科学基金资助项目(ZD201403);国家林业局林业行业公益专项基金(201504307);哈尔滨市应用技术研究和开发项目(201504307);黑龙江工程学院教育科学研究规划项目(JG1410);黑龙江省大学生创业实践项目(201611802059)

宋海峰(1981-),男,讲师,博士研究生.

陈广胜(1969-),男,教授,博士.

猜你喜欢
波段正确率光谱
基于三维Saab变换的高光谱图像压缩方法
门诊分诊服务态度与正确率对护患关系的影响
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
M87的多波段辐射过程及其能谱拟合
星载近红外高光谱CO2遥感进展
日常维护对L 波段雷达的重要性