基于多重循环的6-DOF机械手迭代学习控制*

2021-05-28 06:40鄢圣华
组合机床与自动化加工技术 2021年5期
关键词:外环内环执行器

鄢圣华,黄 松

(1. 湖北理工学院机电工程学院,湖北 黄石 435003; 2. 江西理工大学机电学院,江西 赣州 341000)

0 引言

现代制造业中工业机械手的轨迹跟踪一直是热门的研究方向,涉及到诸多应用场景,包括焊接、激光切割、零件组装和施胶等。大多数机械手采用齿轮马达,因为它们具有成本效益高、重量轻、在扭矩扰动影响小的特点[1]。然而,这会引起齿轮传动导致的非线性问题。因此,末端执行器的跟踪性能会受到内部和外部因素的影响[2]。内在因素包括运动参数的准确性、关节的灵活性、驱动动力学以及关节摩擦和齿轮间隙等非平顺性。外在的误差源为过程干扰。

由于工业过程的重复性,机器手迭代学习控制在重复干扰下的跟踪应用得到了广泛的研究[3-8]。迭代学习控制也是一种有效的参数辨识工具,例如,Chen W等[6]提出了一种基于电机侧和负载侧的双阶段迭代学习方法,以便提供更好的末端效应器跟踪,并提高了学习效率。Zhao Y M等[7]提出利用迭代学习控制算法对轨迹运动参数进行细化,以提高定位精度的方法。如果执行器上的摩擦效应可以重复,也可以通过迭代学习控制进行补偿。为了解决关节的柔性问题,最近,为了获得系统的鲁棒性能,Wang C等[8]提出了在系统不确定情况下的鲁棒迭代学习控制,获得了基于迭代学习控制的较好的机械手跟踪性能。但是,这些方法均为基于模型的方法,需要进行大量的系统识别才能进行学习滤波器设计,且位置跟踪误差仍不够理想。

为了提高机械手的跟踪性能,本文基于上述双阶段迭代学习控制概念,设计了一种只需要标称运动学参数和一些简单系统响应的双重循环迭代学习控制方法。所提出的方法使用基于数据的反演技术进行内环学习滤波器的设计,可以结合运动约束,例如系统的速度、加速度和加速极限。采用有限脉冲响应(FIR)表示的合成滤波器提供了良好的反演逼近、快速迭代学习控制收敛和良好的关节跟踪性能。外环学习矩阵采用了简单的逆雅可比矩阵,不需要额外的系统识别。该方法是基于命令的,这意味着它只改变发送到现有位置伺服回路的关节命令,因此不需要额外的信号访问,可以很容易地进行应用。

1 双重循环迭代学习控制原理

所提方法首先假设每个驱动单元是一个独立的线性单输入单输出系统。另外一个假设是,当关节跟踪误差收敛时,末端执行器误差主要归因于静态偏差(如运动学参数不精确)和重力引起的变形[9-11]。所提双重循环迭代学习的原理框图如图1所示。

图1 双重循环迭代学习的原理框图

2 内环迭代学习控制

2.1 基于反演的迭代学习控制

考虑一个预稳定的车间G,一般的迭代学习控制更新规则可以写成如下:

uj+1=Q(z-1)[uj+F(z-1)ej]=

Q[uj+F(r-yj)]=

Q(1-FG)uj+QFr

(1)

式中,r为要跟踪的参考轨迹,uj为控制序列,j为迭代索引,yj为输出序列,ej为跟踪误差,F为学习滤波器,Q为用于鲁棒性的零相位低通滤波器。

当收敛速度γ满足如下条件时,式(1)中的递推公式是渐近稳定的。

γ‖Q(1-FG)‖∞<1

(2)

式中,‖·‖∞为无穷范数运算,并且z域中的收敛误差e∞可以表示为:

(3)

与上述基于模型的方法不同,本文采用基于数据的反演技术的特点是无需任何建模。如果输入数据能充分激发系统动力学,并且输出数据具有较高的信噪比,则通常能提供令人满意的反演质量。

2.2 基于数据的运动约束反演

本文采用了Teng K T等所提的动态反演方法[9],这是出于几个方面的考虑。首先,该方法适用于信噪比较高的机器手。其次,可以使用频域加权来解决执行器限制和模型不确定性。该方法直接从数据中使用系统动态的FIR表示,不存在模型拟合误差。

基于数据的反演方法简要步骤如下:

(1)用阶跃响应数据构造具有FIR表示的车间G(z-1)。

(2)用平滑窗口函数w[n]卷积g[n],然后用充分的零填充卷积序列gw[n]。

(3)计算G(z-1)和M(z-1)的离散傅里叶变换(DFT),其中M(z-1)是期望的零相位参考模型。然后,应用频域划分构造反演F(z-1)。

在实践中,识别输入可以按如下方式进行启发式设计。假设给定了运动约束、传感器噪声统计和期望信噪比。我们从一个位置脉冲开始,其幅度由规定的信噪比决定,然后检查是否满足所有的运动约束。如果是,则可以增加脉冲的幅度,直到激活其中一个约束,否则改为使用下一个导数(速度)的脉冲,并且以类似的方式调整幅度。

3 外环迭代学习控制

在该节中,针对关节编码器看不到的静态误差,开发并分析了外环迭代学习控制。假设外环更新规则具有以下形式:

δqi+1=Q(δqi+Liδri)

(4)

式中,δqi为第i次迭代的关节命令校正输入,Q为用于噪声衰减的低通,δri为末端执行器输出,Li为有待确定的学习矩阵。

图2 具有收敛内环的外环学习结构

然后,使用代数方法来选择Li。假设输出yi是输入q的静态映射y=f(q,p),其中p包含机械手的运动学参数。通过输入qr和真实参数向量pr来实现期望输出,使得yr=r*=f(qr,pr)。然后,式(4)中的末端执行器误差δri可以展开如下:

δri=yr-yi=

f(qr,pr)-f(qi,p0)=

Fq(qr-q0-δqi)+Fp(pr-p0)

(5)

接着再将末端执行器误差δri代入式(4)中得到:

δqi+1=Q(I-LiFq)δqi+QLiFq(qr-q0)+

QLiFp(pr-p0)

(6)

4 实验结果与分析

为了证明所提双重循环迭代学习控制算法的有效性,选取了一条包含6个关节同时运动的笛卡尔空间线性路径[12-14]进行了测试分析,如图3所示。

图3 笛卡尔工作空间中的线性测试路径

图中,灰色粗实线为机器手初始配置;黑色细虚线为线性测试路径;圆圈为系统识别的末端位置。采用了基于C/C++编程控制(运行频率为1 kHz)的6-DOF模块化机械手MT-ARM,如图4所示。

图4 6-DOF机械手

机械手最大端速度为200 mm/s,将测试两种不同的有效载荷686 g和2732 g(相当于最大载荷的10%和40%)。激光跟踪器(AT901,Leica)用于外环迭代学习控制执行和末端执行器位置误差评估。首先实施内部循环迭代学习控制设计过程,然后将其与外部循环相结合,以展示整体性能。

4.1 内环迭代学习控制设计

在此,仅使用关节J2来演示内环迭代学习控制过程,因为J2承受的载荷随重力变化最大[15]。首先,选择参考模型M和低通滤波器Q。M用于在有限带宽内对系统进行反演分析,从而不会触发输入饱和,而在(1-FG)≈(1-M)变大时Q衰减学习增益来保证稳定性。由于反演的有效性受M的限制,Q的带宽应小于或等于M的带宽。其次,利用图5中的脉冲参考充分激励系统动力学,约束为20 deg/s。

图5 具有运动约束的脉冲参考

按照2.2节中描述的步骤,如图6和图7所示构造反演,其中显示时域和频域响应。

图6 时域有限脉冲响应

图7 频率响应

按照图3所示线性测试路径进行了内环迭代学习控制,实验和仿真的收敛结果如图8所示,其中迭代0表示伺服环性能。

(a) 实验 (b) 仿真图8 关节误差收敛曲线

图9 选择参考模型、低通滤波器和最佳灵敏度的频率响应

4.2 跟踪性能分析

进行了多重循环的迭代学习控制实验,其中外循环迭代次数I= 2,内循环迭代次数J= 5。图10和图11分别显示了686 g和2732 g有效载荷的实验结果。

图10 686 g有效载荷的跟踪性能

图11 2732 g有效载荷的跟踪性能

图10和图11中的上部分为不同迭代的欧式距离误差变化情况,迭代0/0表示标称伺服环(PID)性能,迭代0/5表示内环迭代学习控制的性能极限,迭代1/5表示一次外环更新后的收敛结果。下部分为实验和仿真的关节均方根(RMS)误差收敛情况。迭代0/1处的均方根误差说明了反演的质量,并且迭代1/1和2/1处的性能与迭代0/0处的性能相当,因为它们对应于没有任何学习动作的命令更新。注意外环几乎在一次迭代中收敛。

以关节1和关机2为例,表1总结了2732 g有效载荷时不同方法在位置跟踪误差上的对比。从表1可以看出,对于关节1和关节2,相比于鲁棒迭代学习控制,本文方法将机械手跟踪的均方根误差和最大误差分别减小了11.06%和17.28%,证明了其先进性和有效性。

表1 跟踪误差对比

5 结束语

本文提出了一种工业机器手的多重循环迭代学习控制方法。内环使用基于数据的反演来进行学习滤波器设计并考虑了运动约束。所得滤波器不需要模型降阶,因而具有良好的逼近性和快速的收敛性。给出了外环迭代学习控制方法,并采用逆雅可比矩阵作为学习矩阵。为了验证该方法的有效性,在6-DOF机械手上进行了仿真和实验研究。该方法只需要机器手的运动学参数,具有良好的学习性和灵活性。后续研究将通过考虑时变动力学和耦合效应来进一步改进学习策略。

猜你喜欢
外环内环执行器
深圳外环高速公路通车
基于弓状下缘的腹腔镜内环网塞修补术治疗成人腹股沟斜疝的效果观察
巩膜外环扎术治疗复发性视网膜脱离的临床观察
双级执行器系统的离散滑模控制
飞机装配预连接紧固件自动化安装末端执行器设计
经脐两孔法腹腔镜腹股沟疝内环高位结扎加脐外侧襞加强术治疗小儿腹股沟斜疝*(附108例报告)
经脐微型腹腔镜内环高位结扎术联合包皮环套术的临床应用
考虑执行器饱和的改进无模型自适应控制
一类具有执行器饱和的非线性系统抗饱和方法研究
某型机低压涡轮外环钎焊技术