基于RBF神经网络的控制器参数优化设计研究

2020-06-22 11:04钟婧佳佟泽友蒋明明黄建友
导弹与航天运载技术 2020年3期
关键词:控制参数微分校正

钟婧佳,赵 洪,佟泽友,蒋明明,黄建友

基于RBF神经网络的控制器参数优化设计研究

钟婧佳,赵 洪,佟泽友,蒋明明,黄建友

(中国运载火箭技术研究院,北京,100076)

以单输入单输出控制系统为研究对象,为快速完成控制器参数整定及优化,提升系统动态性能和稳态性能,提出了一种基于RBF(Radial Basis Function)神经网络的控制器参数优化方法。利用RBF神经网络的局部逼近能力和自学习能力,构造出控制系统辨识与控制器参数优化双网络结构,实现了对被控对象的在线辨识及增量式不完全微分PID控制器参数的在线迭代,快速完成控制器参数的整定,在保证系统动态特性的同时,大幅提升稳定精度。

控制系统;参数优化;RBF神经网络;系统辨识

0 引 言

模糊控制和自适应控制是智能控制的两个重要分支,在实际应用中,对于非完全已知的系统和难建立精确数学模型的系统能起到较传统控制理论更为优越的控制性能。由于神经网络具有逼近任意非线性关系的自学习能力,在现代控制领域中得到越来越多的应用。PID控制及不完全微分PID控制由于其算法简便、鲁棒性强的特点,是经典控制中的主要方法,但是控制器的参数整定方法仍存在较大优化空间。因而将经典控制和神经网络相结合,以便改进传统经典控制方法的控制性能,成为各领域单输入单输出控制系统设计的研究热点[1~6]。

本文以平台稳定回路控制系统为研究对象,提出一种基于径向基函数(Radial Basis Function,RBF)神经网络的自适应控制方法,利用RBF神经网络的局部逼近能力和自学习能力,构建了被控对象的模糊系统辨识网络及控制器参数优化网络,实现增量式不完全微分PID控制器参数的在线整定,在满足系统动态特性要求的同时,大幅提升系统稳定精度。

1 问题描述

由于复杂系统的数学模型建立存在近似性,且存在设备老化等引起的参数漂移问题,因而无法准确建立被控对象的数学模型,这对控制器参数的整定带来较大误差。因此设计一种既能完成复杂系统模型辨识,又能快速实现参数整定、提升系统动态性能和稳态性能的自适应控制器具有一定的工程意义。

2 控制器参数优化系统设计

2.1 RBF神经网络的原理分析

神经网络是通过人工模拟人脑的工作机理来实现智能辨识,具有很强的自学习能力和非线性逼近能力,不仅可以实现线性系统的辨识,还可以用来解决复杂的非线性、时变性、不确定的系统辨识问题。神经网络是一种具有自适应和自学习功能的系统辨识方法,它可以通过在线或离线的方式,对训练样本的输入和输出进行学习并不断调整内部参数,使输出值可以无限逼近于理想值,因此可以在不了解系统内部机理的情况下进行系统辨识[7~11]。

RBF神经网络是一种3层结构的局部逼近式学习网络,其中输入层的神经元个数与被辨识系统的输入信号维数相同,隐含层单元数由辨识对象的结构和需要决定,第3层为输出层,是模型对输入信号做出的响应,一般为1个,其网络结构如图1所示。

图1 RBF神经网络结构

RBF神经网络利用高斯基函数在有限范围内为非零值的特点,以一种局部逼近的方式大大加快学习速度并避免多层前馈网络(Back Propagation,BP)是网络等存在的局部极小问题[12]。它模拟了人脑中局部调整、相互覆盖接受域的神经网络结构,利用高斯基函数值在输入空间的有限范围内为非零值,实现局部逼近。RBF神经网络因径向基函数的结构特点,由输入到隐含层的映射是非线性的,而从隐含层到输出层只是加权形式的线性运算,因此它具有逼近任意连续函数的优势。此外,它具有局部逼近的特点,可以对手动整定的控制器参数进行进一步的学习优化,得到控制精度更高的控制器参数。且不同于其他神经网络结构,其局部参数调整的特点可以大大加快控制器参数的学习速度,提高效率,其逼近原理框图如图2所示。

图2 RBF神经网络逼近原理

2.2 整体架构设计

不论系统的模型是否已知,RBF神经网络都可以通过不断地自学习使网络输出无限逼近于实际系统输出。因此可以利用其这一特点来复现被控对象并通过不断迭代更新,将控制系统的参数进行优化。特别的是,RBF神经网络既可以对已知模型的系统进行控制参数优化,又可以根据实际系统输入输出逼近未知模型的复杂系统并完成控制参数优化。

针对已知系统模型的系统,单凭经验对控制器的各参数进行调试难免不能兼顾所有技术指标。通过不断调试仿真得到的控制器参数可以大致使响应曲线的超调量及调节时间达到要求,但很难兼顾稳定精度这一指标达到最优,因此本节利用RBF神经网络的局部逼近原理对控制器参数进行进一步优化,在满足其他动态性能要求的同时,提高系统的稳定精度。其原理如图3所示。

图3 基于RBF神经网络的PID自校正控制

从图3可见,利用RBF的逼近能力和自学习特点与不完全微分PID自校正控制器、控制参数调节器、被控对象共同组成一个神经网络自校正控制系统,从而实现对象参数自动整定的自适应控制技术。自校正控制系统是由两大部分组成:a)神经网络辨识器与控制参数调节器的设计,这是两个并行的学习网络,神经网络辨识器以系统的控制器输出与被控对象的输出作为RBF网络的输入,通过不断迭代的网络输出值可以无限逼近系统输出。每次更新迭代生成的Jacobian信息实时地传递给控制参数调节器,从而进行第2个学习网络,迭代更新各参数的变化量最终传递给不完全微分PID自校正控制器进行参数优化。b)以不完全微分PID自校正控制器与被控对象构成的反馈回路,自校正控制器根据控制参数调节器在每个采样周期内的变化量进行参数的不断更新优化,使系统响应输出朝着高稳定精度的方向发展。

2.3 增量式控制器算法及参数更新的实现

由于不完全微分PID的数字控制器在每一个采样周期的输出都与过去状态有关,且每次计算都会对系统误差量进行累计,大大增加了数字控制器的计算量。因此这里选用增量式不完全微分PID控制算法,即数字控制器的输出是控制量的增量。其中不完全微分PID的数字控制器在第个采样周期的输出为

根据递推原理可得:

因此,得到控制增量:

其中,控制器参数依据梯度下降法进行迭代更新,更新量可以表示为

Jacobian信息是通过神经网络辨识器进行在线逼近得到的,可以看出,当控制器的输入误差量小到一定程度时,控制器4个参数是基本保持稳定的,又因为RBF神经网络是局部逼近的,因此可以在保证系统动态性能不变的情况下提高稳定精度。

3 控制器参数优化效果验证

为验证RBF神经网络对控制器参数的优化效果,根据2.3节的推导公式,利用RBF神经网络对被控对象输出进行实时逼近,并对被控系统的不完全微分PID控制器的各参数进行不断迭代更新,用最终得到的控制器参数对系统进行校正,并与原系统输出进行对比,验证参数优化的效果。

通过仿真实验,得到模型辨识网络的预测输出与辨识对象的实际输出对比图,以及网络的逼近误差收敛曲线,如图4所示。

图4 模型辨识网络输出逼近结果

由图4可知,由RBF神经网络组成的模型辨识网络的输出在迭代更新不到50次就可以无限逼近于实际输出,其逼近精度达到10-8,因此其提供给参数优化网络的Jacobian信息较为精确,有利于参数优化的水平。随着不断迭代更新,Jacobian信息、不完全微分控制器参数都慢慢趋于平稳,其参数更新曲线以及自校正系统误差曲线分别如图5所示。图5中纵坐标为无量纲响应输出。

图5 不完全微分控制器参数曲线

从图5可以看出,提供给调节控制器的Jacobian信息最终趋于平稳,自校正系统的控制器参数最终也趋于稳定,并且系统的误差曲线是收敛于0的。从参数赋值到趋于平稳整个过程可以在不到0.1 s的时间内完成,可以看出RBF神经网络的局部逼近和学习能力很强。进一步对比分析RBF神经网络优化控制器参数的优劣,这里将原校正参数与优化后参数分别带入控制器对原系统进行校正,对比二者的控制效果,如图6所示。

图6 控制器参数优化前后系统输出曲线

由仿真结果可知,经RBF神经网络优化后的控制器参数可以很好地保证系统响应输出的动态特性,且最终稳定精度可以由10-3提升到10-5量级,因此验证了基于RBF神经网络的自校正控制方法的可行性。这种方法不仅可以适用于模型已知的系统参数优化,还可以适用于模型未知的在线参数优化。

4 结 论

针对以单输入单输出为代表的控制系统控制器参数整定问题,利用RBF神经网络的局部逼近能力和快速学习能力可构建模糊对象的在线模型辨识网络及控制器参数优化网络双网络结构,实现复杂控制系统的控制参数在线整定,进而大幅提升控制系统的动态性能和稳态性能。此外,由于RBF神经网络具有局部逼近任意非线性特性的特点,因而这种复合控制方法适用于寻求控制器参数的局部最优解,可作为控制器参数粗调整后的精细化优化手段。

[1] 魏宗康. 动调陀螺四轴平台系统建模及其智能控制设计[D]. 北京: 中国运载火箭技术研究院, 2001.

Wei Zongkang. Modeling and intelligent control design of dynamically tuned gyroscope four axis platform system[D]. Beijing: China Launch Vehicle Technology Research Institute, 2001.

[2] 付常亮, 王玮. 三轴旋转式惯导平台框架控制耦合问题研究[J]. 微型机与应用, 2015, 34(4): 79-82.

Fu Changliang, Wang Wei. Research on control coupling of three axisrotary inertial navigation platform frame[J]. Microcomuter and Its Application, 2015, 34(4): 79-82.

[3] 徐江华. 自整定PID控制的理论、软件及应用研究[D]. 上海: 上海交通大学, 2004.

Xu Jianghua. Research on theory, software and application of self tuning PID control[D]. Shanghai: Shanghai Jiaotong University, 2004.

[4] Simon O, Andreas K, Phillip T. Observer-based nonlinear control strategies for Hardware-in the Loop simulations of multiaxial suspension test rigs[J]. Mechatronics, 2017(10): 7-20

[5] 宋金来, 甘作新, 韩京清. 自抗扰控制技术滤波特性的研究[J]. 控制与决策, 2003, 18(1): 110-119.

Song Jinlai, Gan Zuoxin, Han Jingqing. Study on the filtering characteristics of auto disturbance rejection control[J]. Control and Decision, 2003, 18(1): 110-119.

[6] Kravaris C, Sotiropoulos V, Georgiou C, et al. Nonlinear observer design for state and disturbance estimation[C]. MA, USA: American Control Conference, 2004.

[7] Abdo M M, Vali A R, Toloei A R, et al. Stabilization loop of a two axes gimbal system using self-tuning PID type fuzzy controller[J]. ISA Trans., 2014, 53(2): 591-602.

[8] 朱明超, 刘慧, 张鑫, 贾宏光. 惯性稳定平台自适应前馈控制[J]. 光学精密工程, 2015, 23(1): 141-148.

Zhu Mingchao, Liu Hui, Zhang Xin, Jia Hongguang. Adaptive feedforward control for inertial stabilized platform[J]. Optical Precision Engineering, 2015, 23(1): 141-148.

[9] Astrom K J, Hagglund T. PID controllers: theory, design and tuning[M]. North Carolina: Instrument Society of America, 1995.

[10] 舒骏逸. 两轴四框架跟踪平台伺服控制系统的设计与实现[D]. 北京: 北京理工大学, 2016.

Shu Junyi. Design and implementation of servo control system for two axis and four frame tracking platform[D]. Beijing: Beijing Institute of Technology, 2016.

[11] 刘金琨. 系统辨识理论及MATLAB仿真[M]. 北京: 电子工业出版社,2013.

Liu Jinkun. System identification theory and MATLAB simulation[M]. Beijing: Beijing Electronic Industry Press, 2013.

Research on Optimal Design of Controller Parameters Based on RBF Neural Network

Zhong Jing-jia, Zhao Hong, Tong Ze-you, Jiang Ming-ming, Huang Jian-you

(China Academy of Launch Vehicle Technology, Beijing, 100076)

Taking single input single output control system as research object, a controller parameter optimization method based on RBF neural network is presented to quickly complete controller parameter tuning and optimization and to improve system dynamic performance and steady-state performance. Using the local approximation ability and self-learning ability of the RBF neural network, a control system identification and controller parameter optimization dual network structure is constructed. Taking this method, the online identification of the controlled object and the online iteration of the parameters of the incremental incomplete differential PID controller is realized. It can quickly complete parameter tuning, while ensuring the dynamic characteristics of the system, greatly improve the stability accuracy.

control system; parameter optimization; RBF neural network; system identification

1004-7182(2020)03-0076-05

10.7654/j.issn.1004-7182.20200314

V448

A

钟婧佳(1994-),女,助理工程师,主要研究方向为导航、制导与控制。

赵 洪(1988-),男,工程师,主要研究方向为导航、制导与控制。

佟泽友(1984-),男,高级工程师,主要研究方向为飞行器总体设计。

蒋明明(1990-),男,工程师,主要研究方向为导航、制导与控制。

黄建友(1990-),男,工程师,主要研究方向为导航、制导与控制。

2020-04-13;

2020-04-27

猜你喜欢
控制参数微分校正
多飞行器突防打击一体化微分对策制导律设计
一类带有Slit-strips型积分边值条件的分数阶微分方程及微分包含解的存在性
再分析降水资料的适用性评估与偏差校正
跟踪微分器的仿真实验分析与研究
炫酷ACR
一种具有自动校正装置的陶瓷切边机
PCB线路板含镍废水处理工艺研究
基于模糊控制的一阶倒立摆系统稳定控制研究
浅析铁路工务类LKJ数据管理
微分在近似计算中的应用