神经网络深度学习算法在地理国情监测中的应用研究

2018-11-05 03:49叶远斌
西部资源 2018年4期
关键词:国情神经网络深度

叶远斌

摘要:开展常态化地理国情监测是广东省基础测绘“十三五”规划重要内容,本文综合利用多时相影像、专题资料及已有矢量成果数据,研究基于神经网络深度学习的地理国情地表覆盖变化检测。实验表明:国情地表覆盖信息提取总体精度优于86.22%,KAPPA系数达到83.04%;与传统人工目视判别方法比较,误检率小于7.05%,漏检率小于10.52%,在人力投入、作业效率、成果质量等有明显优势。

关键字:地理国情监测;深度学习;特征提取;变化发现

引言

地理国情是指与地理相关的自然和人文要素的国情,是从地理的角度采用空间化的方法,对国情进行持续观测并对观测结果进行描述、分析、预测和可视化的过程。按照国务院对地理国情监测工作总体部署和测绘地理信息事业转型发展需要,从2016年起地理国情信息获取进入常态化监测阶段,在地理国情普查的基础上,进行地理国情监测业务化运行建设,构建功能完备的地理国情动态监测与综合信息分析发布系统,形成常态化地理国情监测机制,提供地理国情信息业务化、常态化服务。

传统基础性地理国情监测方法主要通过对遥感卫星影像及相关专题资料整合预处理后,将上年度成果数据叠加到监测影像上,人工逐格网进行检查识别,对于局部或个别的地物、地类变化,可在变化区域识别的同时完成变化信息提取;对于范围较大,内部变化比较复杂的变化区域,可先勾画出变化区域的整体范围,然后由专门的信息采集人员完成变化信息提取,存在人工投入大、作业效率较低、自动化智能化不足、对漏判错判等图斑难以发现等突出问题,监测成果能较好满足《基础性地理国情监测数据技术规定GQJC 01-2017》要求。本文探索采用神经网络深度学习方法对地理国情地表覆盖变化信息进行提取研究,并综合已有样本成果,与传统人工目视判读成果进行比较,结果表明该方法具有较高的准确度,变化信息提取效率明显提高。

1.深度神经网络学习

2006年,Hinton首次提出了“深度信念网络”的概念。与传统的训练方式不同,“深度信念网络”有一个“预训练”(pre-training)的过程,这可以方便的让神经网络中的权值找到一个接近最优解的值,之后再使用“微调”(fine-tuning)技术来对整个网络进行优化训练。这两个技术的运用大幅度减少了训练多层神经网络的时间,并将多层神经网络相关的学习方法赋予了一个新名词即“深度学习”。

在浅层神经网络的输出层继续添加层次,原来的输出层变成中间层,新加的层次成为新的输出层.依照这样的方式不断添加,可以得到更多层的多层神经网络。使用矩阵运算的话就仅仅是加一个公式而已。在已知输入a(1),参数W(1)、W(2)、W(3)的情况下,输出z的推导公式如式1所示。随着层数的增加,整个网络的参数就越多。而神经网络其实本质就是模拟特征与目标之间的真实关系函数的方法,更多的参数意味着其模拟的函数可以更加的复杂,可以有更多的容量(eapeity)去拟合真正的关系。

在单层神经网络时,使用的激活函数是sgn函数。两层神经网络时,使用的最多的是sigmoid函数。而到了多层神经网络时,ReLU函数在训练多层神经网络时,更容易收敛,并且预测性能更好。因此,本文采用非线性函数是ReLU函数。ReLU函数不是传统的非线性函数,而是分段线性函数。其表达式y=max(x,0)。在x大于0,输出就是输入,而在x小于0时,输出就保持为0。这种函数的设计启发来自于生物神经元对于激励的线性响应,以及当低于某个阈值后就不再响应的模拟。

2.神经网络深度学习提取国情地表变化

针对基于人工判读地理国情监测方法在人力物力强度等方面的劣势,探索地理国情监测自动化、智能化变化检测技术成为迫切需求。人工智能、模式识别等新理论新技术特别是机器学习密切结合面向对象遥感技术应运而生,是当前遥感学界、计算机学界研究热点之一。

传统机器学习倾向于使用符号表示知识而不是数值表示,使用启发式方法而不是算法,使用归纳而不是演绎,前一倾向使它有别于人工智能的模式识别,后一倾向使它有別于定理证明、经典逻辑等分支。其中,基于神经网络深度学习是一类基于生物学对人脑进一步认识,将神经-中枢-大脑的工作原理设计成一个不断迭代、不断抽象的过程,以便得到最优数据特征表示的机器学习算法。该算法从原始信号开始,先做低级抽象,然后逐渐向高级抽象迭代,由此组成深度学习算法的基本框架。多隐含层的人工神经网络具有优异的特征学习能力,学习特征对数据有更本质的刻画,有利于可视化或分类。同时,深度神经网络在训练上的难度,可以通过逐层初始化来克服。

2.1学习样本库及训练

地理国情成果样本库是提高机器自动分类精度重要数据支撑,利用机器学习方法,通过实验测试,原则上每类地物样本量不低于1万,以提高学习成果的准确性。建立地理国情监测不同地物类型的样本库,其中国情要素样本库内容划分为铁路与道路、构筑物、人工堆掘地、水域、地理单元5大类。利用深度网络学习模型进行训练的实质就是通过构建具有多隐层机器学习模型和海量样本训练数据,学习记忆优化特征参数(即连接权值),从而提升分类精度。本次设计模型结构具有6层隐层节点,通过逐层特征变换,将样本在原空间的特征表示变换到一个新的特征空间。图2为某建筑物所建立的样本库,图3为训练样本分布。

2.2特征信息提取

深度神经网络用于变化识别是一种基于特征的方法,这些特征主要包括:光谱特征、指数特征、形状特征、纹理特征、邻接关系、层次关系等,涵盖了高分辨率影像上可以利用的图像信息。监督/非监督分类等基于传统统计分析的分类方法难以充分采用上述特征信息,同时,区别于传统的人工特征提取和针对特征的高性能分类器设计,经过多层非线性映射,使网络可以从未经特殊处理的训练样本中,自动学习形成适应该识别任务的特征提取器和分类器,该方法降低了对训练样本的要求,而且网络的层数越多,学习到的特征更具有全局性。

通过该方法对某研究区域地表覆盖进行图像分类,如图4。结果表明:该方法分类总体精度优于86%,Kappa系数达到83%,具有较好的分类精度。

2.3变化发现与精度比较

自动化智能化变化发现是开展常态化地理国情监测关键技术之一,本文通过在前时相矢量和后时相分类结果中进行分析,并与CC码比较,得到研究区域变化图斑,如图5所示。

对变化图斑按照面积大小进行排序,从面积大的开始,人工确认是否发生变化。变化发现图斑与人工变化检测图斑进行比较,如图6、7所示。

假定基于人工判读变化检测结果为标准成果,采用误检率、漏检率两项指标进行统计评价,并结合作业生产效率指标进行比较,如表1所示。

可见基于神经网络学习的地理国情地表覆盖变化与基于人工判读方法相比,能够较准确的提取出变化点及范围,有更快的效率。但也存在一定问题,对识别出的范围或区域分类错误还较高,尚需要人工进行图面检查。

3.结束语

本文在结合地理国情监测某实验区域实践基础上,在基于主动学习的样本库构建技术、面向对象分类技术、人机交互的变化图斑确认与编辑等核心技术基础上,利用多时相影像、专题资料及前期矢量成果数据,研究探索利用基于神经网络深度学习的地理国情地表覆盖变化检测算法,包括样本库构建、样本选择与训练、影像分割、特征提取、变化检测、精度评价等主要环节。试验表明该方法能够较快识别变化区域的位置,但提取变化区域范围、识别变化类型等方面表现不佳,需要进一步研究完善。

猜你喜欢
国情神经网络深度
深度理解一元一次方程
神经网络抑制无线通信干扰探究
深度观察
深度观察
深度观察
基于神经网络的拉矫机控制模型建立
地理国情监测知识支持库初步设计
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
特定国情教情中的中小学校自主权