视觉导航技术发展综述

2015-02-10 02:31管叙军王新龙

航空兵器 2014年5期

管叙军+王新龙

摘要：介绍了视觉导航的概念及其发展历程，分析了视觉导航系统的基本组成模块及其优势。根据视觉信息的基本处理过程，重点对视觉图像预处理技术、视觉图像特征提取技术以及视觉定位技术等方面进行了详细的介绍，并讨论了各项技术国内外的研究现状。最后，指出了视觉导航技术的相关难点以及未来的发展趋势。

关键词：视觉导航；图像预处理；图像特征提取；视觉里程计；地标点匹配

中图分类号：TP391 文献标识码：A 文章编号：1673-5048（2014）05-0003-06

0 引言

视觉是用计算机实现人的视觉功能———对客观世界的三维场景的感知、识别和理解。视觉是在20世纪50年代从统计模式识别开始的，当时的工作主要集中在二维图像分析、识别和理解上。60年代，Roberts将环境限制在所谓的“积木世界”，即周围的物体都是由多面体组成的，需要识别的物体可以用简单的点、直线、平面的组合表示，并对物体形状及物体的空间关系进行描述[1]。70年代，已经出现了一些视觉应用系统[2-3]。1973年，英国的Marr教授应邀在麻省理工学院（MIT）组建并领导研究小组从事视觉理论方面的研究。1977年，Marr提出了不同于“积木世界”分析方法的计算视觉理论———Marr视觉理论，该理论在20世纪80年代成为视觉研究领域中的一个十分重要的理论框架[4]。

随着视觉研究的深入以及半导体和计算机技术的发展，视觉信息正被越来越多地应用到导航的实践中。其中，视觉导航是一种利用可见光与不可见光成像技术进行导航的方法，它具有隐蔽性好、自主性强、测量快速、准确，以及廉价、可靠等优点。因此，越来越多的研究者投身于视觉导航技术的研究，尤其是最近30年，随着新概念、新方法、新理论的不断涌现，视觉导航在飞机、无人飞行器（UAV：UnmannedAirVehicles）、各类巡航导弹、深空探测器以及室内外机器人等方面得到了广泛的应用[5-10]，在国内，随着月球探测二、三期工程的展开[11]以及多型号UAV的研发，视觉导航技术发展迅速。

本文从分析视觉导航技术的优势和国内外研究现状出发，讨论了该方法的关键技术，重点对视觉图像预处理技术、视觉图像特征提取技术以及视觉定位方法等方面的研究进展进行详细介绍，并指出视觉导航定位技术存在的问题和发展趋势。

1 视觉导航系统基本组成模块及特性分析

视觉导航系统一般以计算机为中心，主要由视觉传感器、高速图像采集系统及专用图像处理系统等模块构成，如图1所示。

视觉传感器获取被测物体表面特征图像，经高速视觉图像采集系统转换为数字信号，由高速视觉图像专用硬件处理系统完成视觉数字图像的高速底层处理，并提取出特征信息的图像坐标，由计算机实现被测物体空间几何参数和位置姿态等参数的快速计算。

根据理论研究与工程实践可知，该方法具有以下几个特点[12-13]：（1）以CCD相机作为图像传感器的视觉导航系统，具有体积小、重量轻、能耗低、视场宽、易于搭载等显著优势；（2）视觉导航算法能够通过提取图像中的信息较为精确地确定相机的位置、速度和姿态信息。由于具有高度优越性以及巨大的应用潜力，视觉导航技术是一种很有前途的导航定位方案。

2 国内外研究现状

对于视觉导航系统，视觉传感器为其提供了原始的和直接的视觉信息，一般称为视觉图像。对视觉图像进行处理及特征信息提取是视觉导航系统应用的前提和基础。

2.1 视觉图像预处理

视觉图像常常被强噪声所污染，需要进行平滑滤波以减弱或消除这种强噪声的影响。目前常用的图像平滑滤波有均值滤波、中值滤波、高斯变换和小波变换等。均值滤波易于设计，在信号频谱和噪声频谱具有显著不同的特征时性能优越，但会使图像边缘变得模糊。中值滤波可以克服上述问题，在去除脉冲噪声的同时能够保持边缘不受干扰[14-15]，但在面对大面积噪声污染时，中值滤波平滑噪声的能力却不及均值滤波。具有“数字显微镜”之称的小波变换可同时进行时频域的局部分析，已成为去噪的一个重要发展方向。1992年，Mallat和Hwang[16]提出奇异性检测理论，根据噪声和有用信号的小波变换在奇异点处模的极大值不同，通过跟踪极大值来消除噪声。1995年，Donoho等人[17]提出了一种非线性小波变换阈值去噪法，保留低频分量的小波系数，通过设定阈值处理高频分量中的小波系数。2000年，JamesS.Walker[18]提出自适应树小波萎缩法，是一种将小波收缩与小波变换的统计特性结合起来的图像去噪新方法，去噪效果相当好。1998年，F.Abramovich[19]提出了一种基于贝叶斯模型的小波阈值滤波方法，建立了先验模型的系数与Basov空间参数的关系，而且这一关系使得先验模型的小波系数中包含了函数的规律特性。1995年，Coifman和Donoho[20]提出了平移不变量小波去噪法，先对图像进行循环平移，然后对平移后的图像进行阈值去噪处理，再对去噪结果进行平均，是对阈值法的一种改进。1994年，Geronimo，Hardin和Massopus[21]提出了著名的GHM多小波，将图像变换成多流数据，然后对多流数据执行多小波变换，对多小波系数阈值化，既克服了单小波的缺陷，又保留了单小波所具有的良好的时域与频域特性。2000年，S. GraceChang[22]提出了一种基于上下文模型的空间自适应小波去噪方法，小波系数被建模成参数未知服从高斯分布的随机变量，通过在算法中使用图像中的局部信息能够达到较好的去噪效果。2002年，HuaXie[23]提出一种将小波贝叶斯去噪技术与马尔可夫随机场模型相结合的图像去噪方法，小波系数均被建模成独立的二维高斯混合模型，但它们的空间相关性被描述成马尔可夫随机场模型。1999年，Candès[24]在小波变换的基础上提出了一种脊波变换理论，先对图像进行radon域变换，然后在radon域中使用小波变换来处理点奇异。2003年，MinhN.Do和MartinVetterli[25]提出了一种有限脊波变换方法，在脊波变换中应用有限radon变换，克服了离散脊波变换不能精确进行信号重组的难题。2000年，Candès和Donoho[26]提出了曲波变换理论，实际上是脊波理论的衍生，其基本尺度呈现出很高的方向敏感度和很高的各向异性。2004年，Candès和Donoho[27]提出了一种新的曲波紧致框架方法，直接从频域进行多尺度分析，用于寻找分段C2边缘的最优稀疏呈现问题。2002年，Minh.N.Do和MartinVetterli[28]提出了一种轮廓变换方法，具有多方向特性和有效的边缘及轮廓捕捉特性，能够满足曲线的各向异性尺度关系，可以实现类似于曲波的快速分解。2006年，A.L.Cunha[29]等提出了具备平移不变性的、非抽取的轮廓变换，通过对金字塔分解和方向滤波器均不采取下采样来实现。

2.2 视觉图像特征提取

视觉图像特征提取是对图像进行识别分类的重要方法，也是实现图像信息理解、处理与决策的基础。在一幅视觉图像中，通常把具有鲜明特征的信息，诸如边缘、角点、圆或椭圆中心，以及图像的形状特征等作为视觉图像特征信息进行提取。在视觉图像中，图像边缘是视觉图像的主要特征信息。1965年，Roberts[1]就提出了一种基于灰度梯度的边缘检测算子。1975年，Fram和Deutsch[30]联合撰写了一篇回顾性的文章，综述了大量经典的早期边缘检测算子，并对它们的效能进行了评价。1992年，R.Nevatia[31]提出了一种模板匹配方法，先进行互相关运算，再进行阈值判决。1998年，德国Steger博士[32]利用Hessian矩阵确定图像中线条边缘的法线方向，然后通过求解法线方向上的极值点得到线条边缘的子像素级位置。2006年，胡坤等[33]在Steger算法的基础上将大模板高斯卷积的递归思想引入线条边缘检测中，提出一种基于Hessian矩阵的子像素精度线条边缘快速提取改进算法。图像中的角点是指图像中具有高曲率的点，是一种具有重要意义的几何特征。1977年，Moravec[34]提出了第一个角点检测方法，用于控制车辆在复杂的道路上行走。Harris[35-36]给出了探测角点的方法———Harris角点探测器，使得算法的检测效果和可重复性大大改善。1997年，剑桥大学Smith[37]提出了著名的SUSAN算子，通过计算基于核心点的SUSAN面积大小，并以此作为初始角点响应。X型角点是一种常见靶标特征点，ChenDZ等[38]通过分析X型角点的图像特征，建立其灰度分布的数学模型，在此基础上提出一种X型角点子像素级提取方法。栅格型角点是另一种较为常见的用于视觉的靶标特征点，陈大志等[39-40]通过分析栅格型角点的图像特征，建立其灰度分布的数学模型，在此基础上提出了一种栅格型角点子像素级提取方法。椭圆或圆在摄像机像平面上所成的像一般仍为椭圆，而椭圆或圆的图像中心通常是视觉导航中所需要提取的信息。当椭圆或圆为一光斑形状，所成像比较小时，重心法是一种提取椭圆或圆的图像中心比较有效的方法。魏新国[41]提出了一些改进的重心法形式。当椭圆图像足够大时，椭圆拟合法是图像中心提取比较适合的方法，魏振忠[42]给出了椭圆拟合法的具体过程。通常，空间椭圆的图像中心并不是椭圆中心所对应像点，针对这一问题，Heikkil[43]对空间圆的情形进行了研究，并建立了空间圆中心在摄像机像平面上的畸变误差模型。2011年，曹世翔等[44]提出了一种多分辨率图像特征提取方法，通过构建边缘图像的Gauss金字塔，从中提取稳定的特征点完成图像匹配，使得误匹配特征点的个数极大减少。

2.3 视觉定位方法

目前，主要有两种视觉导航定位方法，分别为：视觉里程计和基于地标点匹配的视觉导航定位方法。

2.3.1 视觉里程计

视觉里程计是一种利用单目或双目摄像机得到图像序列，然后通过特征提取、匹配与跟踪估计载体运动信息的导航定位方法。

1987年，Matthies等人[45]提出了视觉里程计的概念，并设计了从图像特征提取、匹配与跟踪到估计载体运动信息的理论框架。2004年，Nistér等人[46]提出了一种实时视觉里程计导航系统，能够实现机器人室外运动导航，并给出了单目视觉里程计和立体视觉里程计的实现途径和流程，为非全向视觉里程计的研究奠定了基础。2004年，Corke等人[47]提出了两种基于全向视觉系统的视觉里程计方案，一种是基于鲁棒的光流法，通过跟踪显著的视觉特征获得每一帧图像的位移；另一种为完全的由运动到结构的方法，利用扩展卡尔曼滤波器估计相机的运动。2009年，Pretto等人[48]以SIFT描述子描述尺度空间的极值，通过基于熵的方法剔除低区别能力的描述子，跟踪兴趣特征，以完成运动估计。2005年，Sünderhauf等人[49]将稀疏光束法平差（sparsebundleadjustment，SBA）应用于立体视觉里程计中，对左右立体像对中的特征运用滑动窗口SBA方法，结合简单的运动阈值滤波方法完成载体运动的估计。2007年，Maimone等人[50]提出了一种利用兴趣算子进行特征检测的方法，通过利用广义归一化（pseudo-normalized correlation）的方法完成左右图像对之间的特征匹配，然后在连续立体图像对中跟踪特征，完成载体运动的估计。2004年，PCA被成功地应用于SIFT描述子的降维运算中[51]，从标准的128维特征空间降到了20维，大大减少了计算量。2011年，Nourani-Vatani等人[52]将线性前向预测滤波用于视觉里程计，能够限制搜索的区域，增加了计算的效率。

2.3.2 地标点匹配导航

地标点匹配导航是事先将环境中的一些特殊景物作为地标，机器人在知道这些地标点的坐标和形状等特征的前提下，通过对地标点的探测来确定自身的位置。

根据地标点的不同，可以分为人工地标点匹配导航和自然地标点匹配导航。1987年，Kabuka和Arenas[53]提出了一种基于人工地标点匹配的视觉导航定位方法，这一方法只受相机焦距的影响，不受其他相机内部参数的影响，而且非常简单与灵活。1997年，Hashima等[54]提出了自然地标点匹配导航定位方法，通过使用相关性跟踪选定的地标点完成载体位置的计算，并在行进过程中逐步更新地标点。2002年，Olson[55]提出了一种通过选取最佳地标点进行导航定位的方法，这一方法是基于极大似然定位算法来确定机器人的位置，不仅增加了定位精度，而且增强了系统的稳定性。2009年，Sim等人[56]提出了一种SLAM（SimultaneousLocalizationandMapping）视觉导航方法，利用粒子滤波同时解决定位和地图创建问题，并通过检测三维地标进行精确定位。2002年，Saripalli等人[57]给出了一种基于视觉导航的微型无人直升机自动降落方法，通过利用Hu不变矩完成降落坪地标图像特征的自动识别实现无人机的自主降落。美国MER漫游车着陆以后，通过利用着陆器和巡视探测器桅杆上的立体相机获得至少3个自然地标点后，采用三角测量的方法确定了火星漫游车的位置，定位精度达到±100m[58]。2007年，Mourikis等[59]提出了一种用于着陆器自主导航的地形匹配定位方法，通过提取CCD相机所拍摄的着陆星球表面图像上的地标点，并与探测星球在轨卫星所形成的数字高程地图进行地标点匹配，从而估计出着陆器的绝对位置及姿态信息。2007年，侯建[60]提出了一种月球车定位方法，利用局部地形图中局部高点相互之间的几何关系与全局地形图中对应高点存在接近的几何关系这一特征，通过特征匹配就可以求得月球车的位置信息。

3 视觉导航定位技术发展趋势

近年来，随着计算机处理速度的不断提高、信号处理技术的不断发展以及各类导航技术的不断完善，视觉导航技术获得了越来越广泛的应用，技术已日趋成熟。但由于载体所处的环境越来越复杂，目前，在视觉导航技术方面仍然有一些关键问题亟待解决。主要有以下几个方面：

（1）图像去噪技术

视觉图像在形成、传输、接收和处理的过程中均会存在一定程度噪声的干扰，使图像质量恶化，甚至淹没图像特征，增加了图像特征提取等工作的难度，因此，图像去噪技术的研究具有重要的意义。目前，小波去噪技术的一个基础性问题是如何为不同的模型找到最理想的小波系数模型，以及如何对非高斯噪声进行建模，可不可以将处理高斯噪声的去噪方法用于非高斯噪声的处理。另一方面，随着脊波、曲波以及轮廓变换等新概念的提出，模型的准确性得到了进一步的提高，并改善了小波的去噪性能，但这些概念的理论基础还不够完善，需要进一步的研究。图像去噪技术的另一发展趋势是根据具体图像选择不同的滤波方法进行结合，能够取得比单一去噪方法更好的效果。

（2）视觉特征提取技术

研究图像目标特征提取的最终目的是让计算机具备人的视觉感知能力与认知能力，代替人完成繁重的图像信息处理工作。但目前很多对人来说轻而易举的任务，计算机却很难做到。在利用多分辨率技术对图像目标特征进行提取方面，如何让计算机自动确定相应的尺度来提取特征还有待于进一步的研究。根据图像的变换系数提取图像特征是一种新的图像特征提取方法，其中，如何将变换系数方法与代数方法结合起来提取图像特征是值得深入研究的方向。另外，由于每一种图像特征提取方法都具有其各自的优势，也都存在其不可克服的缺陷，因此，将多种图像特征提取方法相结合同时应用于同一图像特征的提取也是未来的研究方向。

（3）视觉定位方法

对于视觉里程计，需要研究如何提高算法的鲁棒性、实时性和精确性；如何通过改进硬件和软件，使得载体的位置和姿态可以得到高精度的实时估计。其中，将精度高但效率低的“批处理”算法与精度相对较低的递归方法相结合的“批处理”-递归混合系统，具有高效高精度的特点，将是视觉里程计一个可行的发展方向。对于地标点匹配方法，有待于进一步提高定位的精度，尤其是对于远点地标法。另一方面，视觉导航定位技术与其他导航定位系统进行组合也是一大发展趋势。

4 结束语

以CCD相机作为传感器的视觉导航定位系统，具有体积小、重量轻、能耗低、视场宽、易于搭载等显著优势，在众多领域得到了广泛的应用。尤其是进入21世纪以后，随着视觉导航算法的发展、视觉传感器的微型化及计算机性能的大幅提高，视觉导航系统几乎被应用在所有导航环境中，其重要性在组合导航系统中得到日益提升。在国外，视觉导航系统研究较早，现已逐渐被应用在无人机、巡航导弹、星际探测器以及机器人等前沿领域；在国内，关于视觉导航领域的研究起步较晚，但也已取得了一些可喜的成果。随着视觉导航在精度、实时性与鲁棒性等方面的不断提高与发展，其必将成为未来导航领域中一个重要的发展方向，具有广阔的应用前景。

3 视觉导航定位技术发展趋势

（1）图像去噪技术

（2）视觉特征提取技术

（3）视觉定位方法

4 结束语

3 视觉导航定位技术发展趋势

（1）图像去噪技术

（2）视觉特征提取技术

（3）视觉定位方法

4 结束语