深度学习在遥感影像目标识别与定位中的应用研究

2019-12-20 09:43隋雪莲张涛曲乔新
科技创新与应用 2019年34期
关键词:遥感影像目标检测深度学习

隋雪莲 张涛 曲乔新

摘  要:长期以来,遥感影像的目标识别与定位主要依靠目视判读和人工手段,误判和漏判情况严重,且检测精度较低。文章介绍了基于深度学习的目标检测算法,探讨了将深度学习应用于遥感影像目标识别与定位需要的关键技术,并对深度学习在目标识别与定位中的应用进行了前景展望。

关键词:深度学习;目标识别与定位;遥感影像;目标检测

中图分类号:TP751         文献标志码:A         文章编号:2095-2945(2019)34-0180-02

Abstract: For a long time, the target recognition and position of the remote sensing image mainly depends on visual interpretation and artificial means, there will be errors and missing situation, the precision is lower. This paper introduces the algorithms of the target detection based on deep-learning, and explores the key techniques required in the recognition and position of the remote sensing image. Finally the application of the target recognition and position based on deep-learning is looked forward.

Keywords: deep learning; target recognition and position; remote sending image; target detection

1 概述

近年來,越来越多的国内外对地观测平台的出现,使得遥感影像呈现出井喷的状态,获取了海量的数据。该数据集呈现典型的大数据5V特征,即数据体量大、影像分辨率多样、数据更新快、地面定位精度高、信息蕴藏丰富等。

在影像应用尤其是目标的识别与定位领域,还长期依赖人工手段、目视判读,容易出现误判和漏判目标的情况,检测精度也比较低。影像获取量大与数据利用率低、重点区域目标更新快与信息提取慢等矛盾日趋突出。深度学习作为机器学习的一种,在图像分类、自然语言处理、降维、地物检测、运动建模、人工智能等领域取得前所未有的成果,与传统的目标检测方法相比,深度学习具有模型表达能力强等优势,对于诸如目标和行为识别这类比较复杂的问题具有良好的效果。

2 基于深度学习的目标检测算法

深度学习是当今流行的机器学习方法。相比于传统方法的对目标先验知识要求高、模型泛化能力差等特点。基于深度学习的遥感图像目标识别采用滑动窗口算法提取感兴趣区域,并利用网络提取特征进行目标检测,得到了越来越多的应用。

在基于深度学习的目标检测算法方面,2014年,RBG(Ross B. Girshick)使用region proposal(候选区域)+卷积神经网络CNN(Convolutional Neural Netwaorks)代替传统目标检测使用的滑动窗口+手工设计特征,设计了R-CNN框架,使得目标检测获得巨大突破,并开启了基于深度学习目标检测的热潮。Fast R-CNN在R-CNN的基础上又做了一些改进,使得网络在Pascal VOC上的训练时间从R-CNN的84小时缩短到9.5小时,检测时间更是从45秒缩短到0.32秒。Shaoqin Ren等人在Fast R-CNN基础上提出Faster R-CNN,让RPN网络和Fast R-CNN网络实现卷积层的权值共享,在图像分类和检测方面取得了进一步的提高。2015年,微软研究院何凯明提出了深度卷积网络的改进-深度残差网络,在图像分类和检测方面取得了进一步的提高。此后,残差网络结构慢慢成为各种卷积网络模型的参照结构,为各类图像处理任务提供优化。2015年,YOLO算法的出现使得深度学习目标检测算法开始有了两步(two-stage)和单步(single-stage)之分。YOLO算法通过共享卷积特征的方式提取候选框和进行目标识别,检测速度较Faster R-CNN也有近10倍的提升。2016年微软研究院的Jifeng Dai 等提出R-FCN算法,通过共享卷积层特征实现目标提取。后续的SSD算法,利用卷积核来预测边界框的类别分数和偏移量,不仅提高了检测精度,同时还提升了检测速度。这些都使得深度学习目标检测算法开始能够满足实时检测任务的需求。

3 关键技术

3.1 目标检测模型的选择及优化

卷积神经网络是一种基于多层监督学习的人工神经网络,由于其较好的容错性、自适应性和权值共享等特点,目前被广泛应用于图像识别、物体检测、语义分割领域等领域。当前常用的卷积神经网络Faster R-CNN,RFCN,SSD 三种检测框架,原理示意如图1。

其中,精度最高的Faster R-CNN效率是最低的,网络复杂度最高的 Inception Resnet 带来的精度提升比较明显。训练过程中,要通过观察分析训练情况,需要不断优化batch及学习率参数,使得随机梯度下降,并且不断收敛。从而寻找最适合训练遥感影像数据目标检测模型的训练参数。

通过数据增强操作提高训练样本的多样性,防止训练过程中样本不足带来的过拟合,同时增强模型的鲁棒性。针对遥感影像,可采用的数据增强方式主要有:(1)变换图像亮度、色调及饱和度。(2)图像旋转及倾斜。(3)增加高斯噪声。(4)图像裁切操作。(5)图像去冗余。

3.2 大区域范围内的目标检测

为解决大区域范围内目标检测识别,采用格网的方式将目标区域划分为若干小区域,然后循环加载各小区域进行目标检测。为保证大区域范围内影像数据均被检测,小区域的长宽比例与客户端容器长宽比例一致。考虑划分网格可能会使影像单个目标被划分在多个小区域内,从而造成漏检的情况,在划分网格时候要确保相邻网格有一定重叠率。

首先,在系统中绘制检测区域,根据检测目标大小规模,将影像缩放至相应的级别规模。然后,将检测大区域根据地图容器大小情况动态划分网格。最后,系统循环调用各网格进行单张图像目标检测操作。显然,增加重叠会增加格网总数量,从而增加数据处理量,降低检测效率。因此,要根据实际情况设置重叠率。由于重叠率的设置,部分影像具有重复检测的可能性,在检测结束后,需要对检测结果进行空间分析,删除重复检测目标,该过程在系统中可半自动化处理,如系统通过要素重叠分析,可自动标注类型相同且位置具有重叠的要素,该类要素往往指向是同一目标,需要辅以少量的人工干预,删除重叠检测内容。

4 应用前景

4.1 在辅助土地规划方面

基于深度学习的遥感影像目标识别可用于土地利用调查,改进原来完全依靠人工勾画图斑,汇总整理分析的方案。随着遥感技术的发展,对于地面观测覆盖面积大,宏观性强,遥感影像分辨率极高,土地的自动识别分类已经成为现实。

4.2 在辅助海上或空中交通管制方面

我國的海岸线长约3.2万公里,港口众多,大量船只在此作业,该应用可对舰船或飞机进行自动检测,如:遇险船只、非法活动舰船、民航飞机等。对于特定的港口或机场,可根据地理信息实时获取该位置的遥感影像,通过目标识别定位系统实现对空中、海上交通的自动检测,改善人工视角小、范围窄、投入大等弊端,实现由人工判读向自动化识别的过渡。

4.3 在辅助国防安全方面

未来的信息化战场是武器单元与指挥系统一体化、多源多时空基准的数据信息协同化作战。目标作为信息条件下局部战争的重要打击对象,具有极其重要的威慑力,如重要目标遭受致命打击,将对国防安全和国民经济造成不可估量的损失。此外,通过对海量遥感数据中信息的挖掘,提取有效的军事信息,识别目标并获取其准确位置,可有效防范敌方打击,反之亦可对敌方重要目标进行精准打击。

参考文献:

[1]殷文斌.卷积神经网络在遥感目标识别中的应用研究[D].中国科学院大学(中国科学院遥感与数字地球研究所),2017.

[2]杨钊.面向图像分类和识别的视觉特征表达与学习的研究[D].华南理工大学,2014.

[3]黄为.基于序关系特征描述的高分辨率遥感影像识别研究[D].国防科学技术大学,2014.

猜你喜欢
遥感影像目标检测深度学习
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
遥感影像资料在海图制图中的应用研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
移动机器人图像目标识别
遥感数字图像处理课程实验综述
基于P3电位的目标检测研究