AGA-BP模型在遥感影像分类中的应用研究

2017-05-24 14:45王海军
计算机测量与控制 2017年5期
关键词:适应度遗传算法阈值

王海军

(鄂尔多斯应用技术学院,内蒙古 鄂尔多斯 017000)

AGA-BP模型在遥感影像分类中的应用研究

王海军

(鄂尔多斯应用技术学院,内蒙古 鄂尔多斯 017000)

作为遥感研究的关键技术,遥感影像分类一直是遥感研究热点;针对目前采用BP神经网络模型进行遥感影像分类时存在的对初始权阈值敏感、易陷入局部极值和收敛速度慢的问题,为了提高BP模型遥感影像分类精度,将自适应遗传算法引入到BP网络模型参数选择中;首先运用自适应遗传算法对BP模型权阈值参数进行初始寻优,再用改进BP算法对优化的网络模型权阈值进一步精确优化,随后建立基于自适应遗传算法的BP网络分类模型,并将其应用到遥感影像数据分类研究中;仿真结果表明,新模型有效提高了遥感影像分类准确性,为遥感影像分类提出了一种新的方法,具有广泛研究价值。

遥感、影像分类、BP神经网络、自适应遗传算法

0 引言

遥感影像分类作为遥感应用中的关键技术,其主要任务是根据地物在遥感影像上的信息特征,从而判别地面物体的类别及其分布情况。目前所使用的遥感影像分类方法主要是数理统计方法,如最大似然法、最小距离法和K均值算法等方法。这些统计方法相对成熟,准确性也被人们认可,但是采用以上分类方法需要一定数量的先验条件, 耗费人力物力财力较大,并且人为因素对分类结果会产生一定影响[1]。神经网络是一种非线性智能处理方法,对数据类型和分布没有特殊要求,容忍度高、容错性强,对于离散的、非正态分布的多源遥感影像数据处理是非常合适的[2]。目前采用神经网络模型进行遥感影像分类应用最多的是BP(back propagation)神经网络,但是BP神经网络存在收敛速度慢、易陷入局部极小值,无法保证全局最优等问题[3-5]。

遗传算法(genetic algorithm,GA)思想来源于生物遗传学,借鉴生物进化规律演化而来,是一种具有高度并行、随机搜索和自适应寻优的方法[6]。因此考虑将遗传算法引入到BP模型优化中,构建基于GA-BP组合算法的遥感影像分类模型。但是遗传算法存在局部寻优能力差、迭代过程缓慢、且易出现震荡和早熟收敛等缺点[7],因此在实验中采用自适应遗传算法(adaptive genetic algorithm,AGA)来优化神经网络模型。实验表明与基于BP算法及改进BP算法构建的模型相比,基于AGA-BP组合算法构建的模型在运行的稳定性及分类精度方面都要优于BP算法模型。

1 AGA-BP遥感影像分类模型构造

本遥感影像分类模型的构造包括数据前期处理,模型构造,图像分类三大部分。其中在数据的前期处理中,需要用到高清遥感图像采集设备,色彩比对仪等硬件。在模型构造部分主要用到高性能电脑及数据存储设备,最后通过输出设备将分类结果输出。由于实际条件限制,本文主要是对分类模型构造算法进行研究,并采用Matlab语言进行编程测试。

1.1 分类模型运行流程

AGA-BP遥感影像分类模型运行流程包括:遥感数据采集、遥感数据处理、模型优化、模型确定和分类结果输出几个步骤,具体运行流程如图1所示。由图1可以看出实际上该分类模型的主要关注点是AGA算法对BP模型参数的优化,通过AGA算法强大的全局运算能力,最终得到一个较好的BP模型初始参数,使BP模型可以快速的找到符合条件的最优解,从而得到好的分类模型。

图1 AGA-BP遥感影像分类模型运行流程图

1.2 AGA-BP算法核心思想

BP网络是一种采用反向传播算法的神经网络,其通常由三层网络结构(输入层、隐含层和输出层)构成,对于隐含层根据需要可以选取一个或多,对于大多数问题,选择单隐含层足以解决问题,所以本文BP网络选择单隐含层,本文BP模型算法的基本结构如式(1)所示。

Y=purelin[W2* tansig(W1*Pn+B1 ) +B2 ]

(1)

从BP模型算法的基本机构可以看出,其在算法运行过程中没有引入任何额外参数,其学习过程完全是根据训练样本对初始权阈值参数W1、W2、B1和B2进行调整,因此初始初始权阈值参数选取的好坏将直接影响到最终模型的性能。本文对初始权阈值的确定首先采用自适应遗传算法优化确定BP神经网络的初始权阈值,确定一个较好的搜索空间,代替一般初始权阈值的随机选取,然后在这个解空间里对网络参数采用改进的BP算法进行训练、学习至收敛,搜索出最优解或者近似最优解。这样既实现了两者的优势互补,发挥了神经网络的广泛映射能力和遗传算法的全局搜索能力,也加快了网络的学习速度,综合提高了整个学习过程中模型的逼近能力和泛化能力。

2 AGA-BP遥感影像分类模型设计

2.1 影像数据预处理

由于采集到的遥感影像数据不是模型可以直接利用的数据类型,所以在将遥感影像数据输入模型之前先将其转换为R,G,B三波段数据,再将三波段数据转换为3行。这样就构成了输入矩阵。再自行定义目标向量,并将其转换为与输入向量结构相同的向量,这样图片数据就转换为矩阵数据,就构成了神经网络模型的训练样本对。本文采用崇明岛遥感影像图片作为实验数据,如图1为实验中用到的图片,图2为经过转换后的数据在Matlab中的存储结果,从图2中可以看出原来分辨率1 090×780的图片数据读入计算机变为3×850200大小的矩阵数据。

图2 实验中用到的遥感图片

图3 读入计算机后的图片数据信息

2.2 AGA算法基本原理

遗传算法即GA算法是通过对自然界生物体遗传、变异来适应外界环境,一代又一代地优胜劣汰,发展进化现象的模拟而产生的。它把所求问题解空间映射为遗传搜索空间,将解对应的所有染色体组成染色群体,并按设定好的函数对染色群体中的每个个体进行评价,进行选择、交叉和变异等遗传操作。经过多代的运算后得到适应度值最好的个体就是所求问题的解。在整个算法运行的过程中,除初始解空间外,涉及的两个主要参数是交叉概率Pc和变异概率Pm,而这两个参数将直接影响算法运行速度和解得收敛性,为了减小Pc、Pm设定不当对运行结果的影响,从而产生了自适应遗传算法即AGA算法,给定Pc、Pm的初始范围,让其在运行过程中根据适应度自行调整,减小对算法运行结果的影响。

2.3 AGA-BP模型算法步骤设计

Step1:参数编码——由于BP模型初始权阈值参数一般取[-1,1]之间的随机数,因此在进行参数编码时,如果采用二进制编码,则每个个体码串会很长,直接影响算法运行时间和精度,因此本文采用实数编码。假设BP模型输入层结点数为m,隐含层结点数为n,输出层结点数r,则遗传算法中每个编码个体X与W1、W2、B1和B2的对应关系如式(2)所示。

X={w111,w112,···,w1mn,w211,w212,···,

w2nr,b11,b12,···,b1n,b21,b22···,b2r}

(2)

Step2:适应度函数确定——遗传算法在进行计算过程中不与外部通信,仅以适应度函数为依据。本文采用BP模型实际输出值与期望输出值之间的误差平方和SE的倒数作为适应度函数,这样可以有效的把BP神经网络算法与遗传算法的评估标准融为一体,提高了BP网络的性能,适应度值F函数计算如式(3)所示。

F=1/SE=1/(T-Y)2=(T-purelin[W2*tansig

(W1*Pn+B1)+B2 ])2

(3)

Step3:自适应参数设计——在参数优化过程中交叉概率Pc和变异概率Pm的选取至关重要,为了提高参数的可用性。本文采用自适应遗传算法,使Pc和Pm能够随适应度变化自动改变。Pc和Pm的计算表达式如下[8]:

(4)

(5)

式中,fmax表示群体中最大的适应度值,favg表示每代群体的平均适应度值,f’表示要交叉的两个个体中较大的适应度值,f表示要变异个体的适应度值。

Step4:遗传操作——根据已设参数,顺序利用以下选择、交叉与变异操作产生新种群,直到算法结束为止。

(1)选择操作 采用标准几何排序选择算法,对种群中个体按照适应度值进行升序排序,按照式(6)和式(7)分别计算最佳个体选择概率和个体累计选择概率,接下来运用轮盘赌选择法对种群中的个体进行选择。

pi=q’(1-p)N(i)-1

(6)

q’=p/[1-(1-p)L]

(7)

其中:p为最佳个体的选择概率,q为个体累计选择概率,N(i)为个体i的适应度值在种群中的排列序号,L为种群规模。

(2)交叉操作:由于本文采用的是实数编码,所以采用算术交叉算子。两个父代染色体Pi和Pj以交叉概率Pc计算交叉次数nc,然后采用式(8) 经过nc次线性组合产生出两个新的子代染色体Ci和Cj将替代父代的Pi和Pj。

(8)

其中为在(0,1)区间产生的随机数。

(3)变异操作 采用非一致变异算子进行变异操作。 设变异操作的对象为Pi,则变异量d(Pi)是Pi、取值区域左右边界ai与bi、当前进化代数gc、最大进化代数gm和形状系数b等参量的函数。

(9)

(10)

式中,t=gc/gm,为在(0,1)区间产生的随机数。

Step5:迭代停止——判断算法是否达到最大迭代次数或期望误差,如果不满足收敛条件则返回到Step4继续进行遗传操作,直到达到停止迭代条件。把经过遗传算法优化得到的初始解进行解码,然后再对加载了解码值的BP神经网络进行训练、学习,形成遥感影像分类模型。

3 实验及结果分析

3.1 参数设置

模型学习参数设为0.01,总训练次数设为1 000,训练目标0.01。对于隐含层结点本文采用夏克文教授提出的黄金分割搜索算法,确定为11,图4为模型基本结构。交叉概率通常比较适当的取值区间是0.6~0.9之间。由于本文采用的是自适应遗传算法,所以可以使交叉概率根据适应度自行调整,Pc1=0.9,Pc2=0.6。同样对于变异概率适当的取值区间是0.001~0.1,因此Pm1=0.1,Pm2=0.001。最大迭代次数100代,对于群体规模本文取n=30。

图4 遥感影像分类模型基本网络结构

3.2 结果分析

图5给出了某代遗传算法适应度值的变化曲线,可以看出经过大概30代的寻优,就找到了最优解。表1分别给出了基于traingd BP算法、基于trainlm BP算法的模型分类结果和基于AGA-trainlm BP算法的模型分类结果,考虑到权阈值的不确定性,每个模型均运行10次,从表中可以看出采用经过AGA算法优化后,BP模型初始权阈值的随机性变小,其运行结果的稳定性与精确度相比采用随机权阈值的两种模型都有了一定程度的提高,同时其最大误差,最小误差之间的差距只有0.004 4,不到1%,平均误差与最大最小误差之间的差距分别是0.002 5、0.001 9,误差均不到1%。由此可见,基于AGA-trainlm BP算法的模型具有更高的分类精度与稳定性。

图5 AGA-BP模型适应度变化曲线

模型maxerrorminerrormeanerrortraingd-BP模型0.10230.08530.0955trainlm-BP模型0.03420.02880.0304AGA-trainlmBP模型0.03220.02780.0297

4 结论

本文主要研究了基于AGA-BP算法的神经网络遥感影像分类模型,在研究中发现在进行遥感影像分类时采用梯度下降BP算法的模型存在训练速度慢,对初始权阈值参数敏感且易陷入局部极小值的问题。针对这个问题采取了两阶段优化,第一阶段采用自适应遗传算法优化初始权阈值参数,第二阶段将优化后的权阈值参数作为BP模型的初始权阈值参数采用改进BP算法进行二次优化,优化后的权阈值参数作为分类模型的最终参数。实验结果表明这种设想是成功的,将自适应遗传算法引入到基于trainlm算法的BP遥感影像分类模型后,不仅可以提高BP遥感影像分类模型分类精度,同时也为采用神经网络进行遥感影像分类提供了一种新的研究方法,具有广泛研究价值。

[1] 李 旭,周买春,梁智宏,等.遥感图像分类方法[J].北京农业,2014(3):217-218.

[2] 卢柳叶,张青峰,李光录.基于BP 神经网络的遥感影像分类研究[J].测绘科学,2012,37(6):140-143.

[3] 周 义,阮仁宗.LM-BP 神经网络在遥感影像分类中的应用研究[J].遥感信息,2010(5):80-86.

[4] 万 雪.基于RBF神经网络的高分辨率遥感影像分类的研究[J].测绘通报,2009(2):18-21.

[5] 黎贵发.基于改进BP 神经网络的遥感影像混合像元分解[J].地理空间信息,2009,7(3):65-67.

[6] 杨国华,朱向芬,周 鑫.基于遗传算法的风电混合储能容量优化配置[J].电气传动,2015,45(2):50-53.

[7] 朱朝艳,刘露旭,唐永鑫.改进遗传算法在框架结构优化设计中的应用[J].辽宁工业大学学报(自然科学版),2016,36(3):168-171.

[8] 黄苏丹, 刘淮源, 曹广忠,等. 基于自适应遗传算法的LED器件多应力条件下寿命快速评估系统模型[J].中国科学,2016,46(9):940-949.

Application of AGA-BP Model in Remote Sensing Image Classification

Wang Haijun

(Ordos College of Applied Technology, Ordos 017000,China)

as the key technology of remote sensing, remote sensing image classification has been a hot spot of remote sensing research. In view of the current BP neural network model for remote sensing image classification, it is sensitive to the initial weight threshold, easy to fall into local extreme value and slow convergence speed, in order to improve the classification accuracy of BP model, the adaptive genetic algorithm is introduced into the parameter selection of BP network model. Firstly, the adaptive genetic algorithm is used to optimize the parameters of BP model weight threshold, then the improved BP algorithm is used to optimize the weight threshold of the optimized network, subsequently, a classification model of BP network based on adaptive genetic algorithm is established, and it is applied to the classification of remote sensing image data. The simulation results show that the new model can effectively improve the accuracy of remote sensing image classification, and put forward a new method for the classification of remote sensing image, which has a wide range of research value.

remote sensing; image classification; BP neural network; adaptive genetic algorithm

2016-12-09;

2017-01-05。

内蒙古自治区高等学校科学研究项目(NJZY16382)。

王海军(1982-),男,内蒙古鄂尔多斯人,鄂尔多斯应用技术学院教师,高级工程师,工学硕士,主要从事人工智能算法应用方向的研究。

1671-4598(2017)05-0212-03DOI:10.16526/j.cnki.11-4762/tp

TP

A

猜你喜欢
适应度遗传算法阈值
改进的自适应复制、交叉和突变遗传算法
土石坝坝体失稳破坏降水阈值的确定方法
基于遗传算法的高精度事故重建与损伤分析
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于遗传算法的智能交通灯控制研究
启发式搜索算法进行乐曲编辑的基本原理分析
辽宁强对流天气物理量阈值探索统计分析
基于人群搜索算法的上市公司的Z—Score模型财务预警研究
基于改进多岛遗传算法的动力总成悬置系统优化设计