一种基于神经网络的中制导改进算法

2016-12-23 01:53魏倩蔡远利
西安交通大学学报 2016年7期
关键词:训练样本算例引力

魏倩,蔡远利

(西安交通大学电子与信息工程学院,710049,西安)



一种基于神经网络的中制导改进算法

魏倩,蔡远利

(西安交通大学电子与信息工程学院,710049,西安)

针对地球扁率影响下的大气层外导弹中段制导问题,提出了基于BP神经网络的模型预测改进算法,并且创新使用轨道偏差解析解来构造训练样本集。首先,利用极点变换方法把弹体受到的J2项摄动引力优化分解为与运动轨迹相关的扰动函数;然后,采用偏差状态空间的转移矩阵,建立起导弹在J2项摄动作用下的轨道偏差公式;最后,利用偏差公式构造取值广泛的训练样本集并训练BP神经网络,从而建立起关于虚拟目标信息的预测模型,计算出中段制导控制所需的增益速度矢量。该模型的优点是利用极点变换和状态转移矩阵直接求解J2项摄动偏差,避免了进行大规模的数值积分运算;神经网络拥有强大的学习能力,保证了预测模型的全面性及精确性;BP神经网络可以预先离线训练、学习,大大缩短了计算时间。与传统Lambert迭代补偿修正方法相比,改进型BP神经网络补偿算法可以同时满足实时计算速度及计算精度的双重要求,具有较强的实际工程意义。

极点变换;摄动偏差;J2项摄动;BP神经网络

在大气层外的远距离导弹攻防作战中,弹体的飞行过程分为主动助推段、中段制导段和末制导段。中段制导段是指飞行器在主动段到达关机点后,末段制导开始之前,飞行器进行较长时间的无控滑行过程。在整个中段制导段,飞行器仅采用脉冲推力等方式进行少数几次飞行状态修正。因此,整个中段制导阶段可以抽象为固定时间的Lambert制导问题,经典方法求解法有传统高斯解法、普适变量法、Battin-Vaughan算法等[1-5],若考虑地球扁率所产生的J2项引力摄动(引力场函数仅包含2阶带谐项),这些方法会产生较大的轨道偏差。

现阶段对于J2摄动下的Lambert制导问题的研究,主要为引力差修正法和补偿Lambert制导法[6-11]。引力差修正法是在中段制导过程中,分阶段对于引力差所产生的轨道偏差进行弹道修正,其优点是制导精度对于飞行状态参数的鲁棒性较好,缺点是引力差的计算进行了大量的近似处理,且修正过程持续整个中制导阶段。补偿Lambert制导法是在经典Lambert制导基础上,补偿修正J2引力摄动对飞行弹道的影响,是一种简单、实用的制导方法。但是,现有的补偿制导法在计算精度和运行时间两方面难以取得平衡,限制了上述方法在实际工程中的应用。

本文提出了基于BP神经网络的模型预测制导算法,并使用偏差解析解来构造取值广泛的训练样本集,这可大大缩短计算时间,满足实时在线计算的要求。

1 改进Lambert制导问题描述

在研究Lambert制导时,通常假设飞行器可以瞬间获得转移轨道所需要的速度增益矢量,不涉及脉冲推力控制问题。

图1 经典Lambert制导下目标点P2与虚拟目标点

2 轨道偏差解析解

2.1 J2项引力摄动的分解

弹体受到的J2项引力函数可表示为[1]

(1)

式中:r为地心距;φ为地心纬度;ae=6 378 137;J=1.082 6×10-3。

图2 极点变换的几何关系

关于极点Op(λp,φp)可由初始点P1位置信息得到,即

(2)

因此,标准椭圆轨道上任意点Q(λ,φ),变换出的新坐标(η,σ)关系式为

(3)

J2项引力摄动的加速度,关于导弹轨迹运动的分量表示为

(4)

其中

(5)

2.2 轨道偏差解析解

为避免直接求解微分方程带来的困难,本文采用偏差状态的转移矩阵直接解算出轨道偏差的解析解。

(6)

当考虑到实际轨道与标准椭圆轨道同为地心距r时,轨道状体参数的偏差称为等地心距偏差。设等地心距偏差构成的状态向量为

(7)

(8)

其中

(9)

图3 等地心距偏差与等地心角偏差的关系

因此,Yr的摄动偏差方程表示为

(10)

由于J2项引力扰动,导弹的轨道偏差可分解为东向和北向两个方向

(11)

式中:Ap2为目标点P2的方位角。

(12)

3 改进型Lambert制导算法

3.1 虚拟目标点预测模型

考虑到Lambert制导问题对于预测精度的要求,引入多隐含层来提高网络预测精度。通过对比分析,采用网络结构为3-9-9-3的4层BP神经网络满足模型的预测精度。

使用BP神经网络建模时,训练样本的选取十分重要。训练样本满足2个条件:①样本数量要足够多,能够反映出关系的复杂程度;②样本需要具有代表性,尽可能包含各种特征模式。

在大气层外导弹的取值范围内以任务目标点P2为中心选取采样数据,构成采样矩阵Ti,j,k(λTi,φTj,tTk),满足条件

(13)

式中:Δλ、Δφ、Δt为小量的采样间隔;i=0,±1,±2,…,±nλ,j=0,±1,±2,…,±nφ,k=0,±1,±2,…,±nt,nλ、nφ和nt分别决定在λ、φ和tF上采样规模的大小。

图4 神经网络训练原理图

因为Δλ、Δφ取值较小,采样样本集中分布在目标点周围一定的范围内,此样本集减小了J2项引力摄动对位置、飞行时间等的复杂影响,使得样本的输出信息也在小范围内变化,小范围变化的各种因素使得映射关系接近于线性关系。同时,此采样集兼顾考虑了时间、空间等因素不同数量级变化对于飞行轨道偏差的实际影响。

3.2 制导方法流程

4 算法验证与分析

假设远距离飞行的导弹只受到J2项引力摄动作用的影响,且不进行导弹末段制导修正,通过仿真实验对以上改进型Lambert制导算法的正确性、可靠性和精度进行验证。

4.1 仿真算例分析

取导弹关机点P1在地心东经纬度为0°、北纬经度为10°、高度为1 200 km处,用2个具体算例来对比分析。在算例1中,假设导弹的任务目标信息为(46.2°,7°,1 150 s)。在考虑到J2项引力摄动下,导弹的无修正落点为(46.260 4°,7.006 5°,1 148 s),落点误差6 754 m。通过BP神经网络预测出虚拟目标点(46.139 7°,6.993 6°,1 151.6 s),BP改进算法的修正效果良好,修正落点误差仅为7.6 m。在算例2中,假设导弹的任务目标为(35°,17°,800 s)。在考虑到J2项引力摄动下,导弹的无修正落点为(34.959°,16.985°,796.6 s),落点误差为4 844 m。通过BP神经网络预测出虚拟目标点(35.040 8°,17.015 3°,803.3 s),修正落点误差仅为2.972 m。

通过对2个算例数据对比可看出:在J2项引力摄动的影响下,导弹的位置偏差为104m,并且偏差随着飞行时间的延长、飞行距离的增长而不断变大;改进型算法利用BP神经网络预测出虚拟目标点,可很好修正J2项引力摄动引起的轨道位置偏差。

根据BP神经网络训练样本的选取规则,算例1中,将任务目标点的信息(46.2°,7°,1 150 s)作为BP神经网络的训练样本的采样中心点,nλ=10、nφ=10、nt=5、Δλ=0.57°、Δφ=0.57°、Δt=20 s,采样样本个数为4 851,随机抽取4 751个样本作为训练样本,剩余的100个样本作为测试数据。

图5 算例1的测试误差率

利用算例1中的训练数据对预先训练完成的BP神经网络(BPnet)进行第2次更新训练,迭代次数为100,均方误差为10-6。由于BPnet网络经过预先训练过程,二次训练的迭代次数为3,训练误差为9.37×10-7,运行时间为1.3 s,测试样本数据的误差为9.6×10-6,测试误差率如图5所示。对于算例2进行相同的神经网络训练,得到二次训练的迭代次数为1,训练误差为8.6×10-7,运行时间为1.64s,测试样本误差为8.5×10-6,测试数据的测试误差率如图6所示。对于BPnet网络的二次更新训练,使得静态BP神经网络能够满足不同任务目标点的相关要求,并且在同一任务目标点周围一定区域中,BP神经网络具有较好的预测能力。

通过2个算例的仿真计算可看出,本文讨论的基于BP神经网络的改进型Lambert制导算法,可很好修正J2项摄动产生的轨道偏差,实现精确的飞行制导。

图6 算例2的测试误差率

4.2 算法对比与分析

忽略关机点测量误差,且不进行末制导修正,在相同的运算环境下分别用BP神经网络改进法及经典虚拟目标补偿修正法进行对比仿真分析。不同算法的仿真精度、计算结果以及所耗费的运行时间如表1所示。

表1 不同算法的仿真效果对比

经典的虚拟目标点补偿法[1]采用数值积分,整个飞行仿真周期为50 s,计算出位置偏差并进行迭代修正,次数一般不小于3,数值积分所耗费的时间相当可观,并且轨道积分的路径差别也影响计算精度。改进型算法使用BP神经网络建立目标点与实际位置之间的映射关系,从而可精准预测出虚拟目标点信息。

仿真对比实验结果表明,BP神经网络改进型Lambert制导策略在计算精度相当的情况下,具有运算量小、方法简便、易于工程实现等优点。

5 结 论

考虑J2项摄动影响的Lambert问题是一个典型的多变量非线性问题,常规方法不能满足计算时间和运算精度的双重要求。本文利用偏差解析解构造出基于BP神经网络的预测模型,并计算得到补偿制导的控制参数,其最主要的优点是:利用状态转移矩阵直接求解J2项摄动引起的轨道偏差,避免了进行大规模的数值积分运算;神经网络的强大学习能力,保证了预测模型的全面性以及精确性;BP神经网络的离线训练、学习,大大缩短了计算时间。此改进型制导算法可同时满足实时计算效率及计算精度的双重要求,具有较大的实际工程意义。

[1] BATTIN R H. Introduction to the mathematics and methods of astrodynamics [M]. Reston, VA, USA: AIAA, 1999: 325-417.

[2] AHN J, lEE S. Lambert algorithm using analytic gradients [J]. Journal of Guidance, Control, and Dynamics, 2013, 36(6): 1751-1761.

[3] AHN J, BANG J, LEE S. Acceleration of zero-revolution Lambert’s algorithms using table-based initialization [J]. Journal of Guidance, Control, and Dynamics, 2015, 38(2): 335-342.

[4] ZHANG Gang, CAO Xibin, ZHOU Di. Two-impulse cotangent rendezvous between coplanar elliptic and hyperbolic orbits [J]. Journal of Guidance, Control, and Dynamics, 2014, 37(3): 965-969.

[5] WAILLIEZ S E. On Lambert’s problem and the elliptic time of flight equation: a simple semi-analytical inversion method [J]. Advances in Space Research, 2014, 53(5): 890-898.

[6] 高海燕, 蔡远利. 高超声速飞行器的滑模预测控制方法 [J]. 西安交通大学学报, 2014, 48(1): 67-72. GAO Haiyan, CAI Yuanli. Sliding mode predictive control for hypersonic vehicle [J]. Journal of Xi’an Jiaotong University, 2014, 48(1): 67-72.

[7] 徐明, 谭田, 李志武, 等. Lambert转移中途修正的全局概率最优策略 [J]. 北京航空航天大学学报, 2012, 38(5): 574-578. XU Ming, TAN Tian, LI Zhiwu, et al. Optimal correction strategy during Lambert transfer from view of probability [J]. Journal of Beijing University of Aeronautics and Astronautics, 2012, 38(5): 574-578.

[8] 胡正东, 郭才发, 曹渊, 等. 轨道轰炸飞行器过渡段轨道设计与制导 [J]. 固体火箭技术, 2009, 32(5): 473-479. HU Zhengdong, GUO Caifa, CAO Yuan, et al. Transition trajectory planning and guidance for orbital bombing vehicle [J]. Journal of Solid Rocket Technology, 2009, 32(5): 473-479.

[9] 柴华, 仲明, 梁彦刚. 采用状态转移矩阵的拦截中段制导方法 [J]. 国防科技大学学报, 2015, 37(4): 137-142. CHAI Hua, ZHONG Ming, LIANG Yangang. Midcourse guidance of interception using state transition matrix [J]. Journal of National University of Defense Technology, 2015, 37(4): 137-142.

[10]郑伟, 汤国建. 扰动引力场中弹道导弹飞行力学 [M]. 北京: 国防工业出版社, 2009: 32-45.

[11]YAMADA K, KIMURA M. New state transition matrix for formation flying inJ2-perturbed elliptic orbits [J]. Journal of Guidance, Control, and Dynamics, 2012, 35(2): 536-547.

[12]邓一兵, 胡伟, 高峰, 等. 遗传神经网络在载人飞船环控决策系统中的应用研究 [J]. 西安交通大学学报, 2010, 44(7): 64-69. DENG Yibing, HU Wei, GAO Feng, et al. Application of genetic neural network to decision support system for environmental control and life support system [J]. Journal of Xi’an Jiaotong University, 2010, 44(7): 64-69.

[本刊相关文献链接]

张小栋,郭晋,李睿,等.表情驱动下脑电信号的建模仿真及分类识别.2016,50(6):1-8.[doi:10.7652/xjtuxb201606001]

姜涛,黄伟,王安麟.多路阀阀芯节流槽拓扑结构组合的神经网络模型.2016,50(6):36-41.[doi:10.7652/xjtuxb201606 006]

宋青松,田正鑫,孙文磊,等.用于孤立数字语音识别的一种组合降维方法.2016,50(6):42-46.[doi:10.7652/xjtuxb2016 06007]

陈江城,张小栋.人体下肢行走关节连续运动表面肌电解码方法.2016,50(6):61-67.[doi:10.7652/xjtuxb201606010]

陈斌,胡平舸,屈丹.子空间域相关特征变换与融合的语音识别方法.2016,50(4):60-67.[doi:10.7652/xjtuxb201604010]

王安麟,孟庆华,曹岩,等.液力变矩器的叶片数神经网络模型.2015,49(7):11-16.[doi:10.7652/xjtuxb201507003]

马忠丽,文杰,梁秀梅,等.无人艇视觉系统多类水面目标特征提取与识别.2014,48(8):60-66.[doi:10.7652/xjtuxb2014 08011]

侯雨伸,王秀丽.气象过程信息挖掘与输电线路覆冰预测.2014,48(6):43-49.[doi:10.7652/xjtuxb201406008]

王万召,王杰.采用限定记忆极限学习机的过热汽温逆建模研究.2014,48(2):32-37.[doi:10.7652/xjtuxb201402006]

冯斌,梅雪松,杨军,等.数控机床摩擦误差自适应补偿方法研究.2013,47(11):65-69.[doi:10.7652/xjtuxb201311012]

(编辑 赵炜)

A Modified Algorithm on the Midcourse Guidance Based on BP Neural Network

WEI Qian,CAI Yuanli

(School of Electronic and Information Engineering, Xi’an Jiaotong University, Xi’an 710049, China)

Aiming at solving the midcourse guidance problem of exo-atmosphere missile under the influence of earth’s oblateness perturbation, a prediction model for missile guidance was proposed based on BP neural network. This method provides a new training sample set constructed by the analytical formula of trajectory deviation. First, by using the pole transform method, the missile’sJ2perturbed gravity is decomposed into the disturbing function related to its flight trajectory. Then, with the state space matrix method, the analytic solution of trajectory deviation with theJ2perturbation is calculated. Finally, using trajectory deviation function to construct a wide range of training sample set, the BP neural network of prediction model is established. The neural network can forecast the virtual target point information, so as to calculate the vector of gained velocity for midcourse guidance control. Using the modified algorithm, the trajectory deviation ofJ2perturbation can be directly solved by pole transform and state transition matrix, avoiding large-scale numerical calculation. The BP neural network has powerful learning and training ability, ensuring the comprehensiveness and accuracy of the prediction model and saving calculation time by the off-line training and learning before the simulation tests. In comparison with traditional correction method of Lambert guidance, this modified algorithm can satisfy the requirements on both efficiency and accuracy of real-time computation, being of practical engineering significance.

pole transform; perturbation deviation;J2perturbations; BP neural network

2015-12-04。 作者简介:魏倩(1984—),女,博士生;蔡远利(通信作者),男,教授,博士生导师。 基金项目:国家自然科学基金资助项目(61308120,61463029)。

10.7652/xjtuxb201607019

V448.2

A

0253-987X(2016)07-0125-06

猜你喜欢
训练样本算例引力
延安新引力
人工智能
近场脉冲地震下自复位中心支撑钢框架结构抗震性能评估
降压节能调节下的主动配电网运行优化策略
提高小学低年级数学计算能力的方法
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
感受引力
基于振荡能量的低频振荡分析与振荡源定位(二)振荡源定位方法与算例
A dew drop