求解时变二次规划的自适应参数归零神经网络 [PDF全文]
(浙江科技大学 信息与电子工程学院,杭州 310023)
【目的】针对时变二次规划(time-varying quadratic programming,TVQP)中的时变参数求解问题,提出了一种自适应参数归零神经网络(adaptive parameter zeroing neural network,APZNN)模型。【方法】首先,在归零神经网络(zeroing neural network,ZNN)模型的基础上引入一种基于误差的自适应参数及增强型双幂(enhanced sign-bi-power,ESBP)激活函数,从而提出了APZNN模型; 然后,利用李雅普诺夫定理分析了APZNN模型的稳定性,预设时间收敛性和鲁棒性; 最后,通过仿真试验以验证APZNN模型的有效性。【结果】在求解时变二次规划问题时,APZNN模型相比ZNN模型和时变参数归零神经网络(time-varying parameters zeroing neural network,TVPZNN)模型,具有更快的收敛速度和更强的鲁棒性,其误差函数能在0.2 s内收敛到0; 得益于自适应参数的引入,APZNN模型在仿真试验中的计算时间较TVPZNN模型减少了16.6 s,节省了计算资源。此外,将APZNN模型应用于UR5机械臂轨迹跟踪试验中,机械臂的末端执行器可以很好地跟踪期望的路径,末端执行器的位置误差被限制在-1.5×10-4 m和1.5×10-4 m之间,这进一步说明模型的可行性。【结论】本研究提出的APZNN模型能够有效地求解时变二次规划问题,可为神经网络模型设计提供参考。
Adaptive parameter zeroing neural network for solving time-varying quadratic programming
ZENG Xuxiang, KONG Ying
(School of Information and Electronic Engineering, Zhejiang University of Science and Technology, Hangzhou 310023, Zhejiang, China)
[Objective] To solve the problem of time-varying parameters in time-varying quadratic programming(TVQP), an adaptive parameter zeroing neural network(APZNN)model was proposed. [Method] Firstly, based on the zeroing neural network(ZNN)model, an error-based adaptive parameter and an enhanced sign-bi-power(ESBP)activation function were introduced to propose the APZNN model; then, the stability, predefined-time convergence and robustness of the APZNN model were analyzed by using Lyapunov theorem; finally, the effectiveness of the APZNN model was verified through simulation experiments. [Result] When solving time-varying quadratic programming problems, the APZNN model boasts faster convergence speed and better robustness compared to the ZNN model and the time-varying parameters zeroing neural network(TVPZNN)model, its error function can converge to 0 within 0.2 s; thanks to the injection of adaptive parameters, in the simulation test the calculation time of the APZNN model is 16.6 s faster than the TVPZNN model, saving computing resources. In addition, applying the APZNN model to the UR5 manipulator trajectory tracking experiment, the end effector of the manipulator can track the desired path well, and the position error of the end effector is limited to between -1.5×10-4 m and 1.5×10-4 m, which further demonstrates the feasibility of the model. [Conclusion] The APZNN model proposed in this study can effectively solve time-varying quadratic programming problems and provide a reference for neural network model design.
引言

二次规划(quadratic programming,QP)问题经常出现在各种科学和工程领域,如图像处理[1]、机器人轨迹规划[2-4]、信号处理[5]和计算机视觉[6]。由于二次规划问题在现实中具有许多潜在应用的前景,因此进行实际问题研究是很有必要的。其中,时变二次规划(time-varying quadratic programming,TVQP)问题因其解决的难度大和应用的广泛性,近年来引起了越来越多研究者的关注。在大多数传统的QP问题求解方法中,例如牛顿数值迭代法[7]及其改进方法[8],通常仅适用于解决静态QP问题,在求解TVQP问题时往往会面临计算时间长和效率低的问题。

在过去几十年里,周期神经网络[9](recurrent neural network,RNN)因其并行结构而被广泛研究。梯度神经网络(gradient neural network,GNN)属于RNN,文献[10]中提出了一种基于梯度神经网络的模型,并从理论上证明了GNN解决线性矩阵方程问题的可行性。然而,在处理TVQP问题时,GNN总是会产生无法消除的残差,这表明GNN在应对时变问题方面存在局限性。为了有效地求解TVQP问题,Zhang等[11]提出了一种归零神经网络(zeroing neural network,ZNN)。与GNN不同,ZNN方法是基于实际问题构建误差函数,并通过计算误差函数对时间的导数,确保误差的每个分量在理论上都逐渐收敛为0。

近年来,ZNN模型引起了许多研究者的关注,针对不同的时变问题,提出了许多改进的ZNN模型[12-13]。总体而言,有两种方法可以提高模型的收敛性能:一种是设计新的激活函数[14]; 另一种是设计新的收敛参数。Li等[15]为了求解时变西尔维斯特方程,在ZNN模型中引入了双幂(sign-bi-power,SBP)激活函数,首次实现了模型的有限时间收敛。与激活函数一样,收敛参数在加快ZNN的收敛方面也有一定的作用。在ZNN模型中,收敛参数被设置为一个固定的常数,然而选取一个合适的固定参数取决于试验者的经验。因此,Xiao等[16]提出了一种时变参数归零神经网络(time-varying parameters zeroing neural network,TVPZNN)模型,该模型可以实现有限时间的收敛性。

然而,时变参数会随着时间的增大而增大,这将导致计算资源的浪费。为了解决模型中收敛参数过大而导致的资源浪费问题,本研究提出了一种自适应参数归零神经网络(adaptive parameter zeroing neural network,APZNN)模型。本模型引入一种基于误差的自适应收敛参数,可以根据误差的值来调节收敛参数的大小,从而避免了因参数过大而导致的计算阻塞,且模型可以在一个预设时间内收敛。与现有的变参数ZNN模型相比,APZNN有着更快的收敛速度,且收敛时间不受系统初始状态的影响。理论分析也证明了APZNN模型的稳定性、收敛性和鲁棒性。最后,通过两个仿真试验来验证了APZNN模型求解TVQP问题的可行性。

1 问题描述

在数学理论中,时变二次规划(TVQP)问题的一般形式如下:

式(1)中:Q(t)∈Rn×n为时变正定黑森矩阵; P(t)∈Rn为系数向量; H(t)∈Rm×n为全秩系数矩阵; K(t)∈Rm为全秩系数矩阵。假设Q(t)、P(t)、H(t)、K(t)及它们的导数信息已知或可以估计。x(t)为式(1)的变量,目标是找到满足TVQP的理论解x*(t)。

为了求解TVQP问题,在拉格朗日乘子法[17]的基础上,设计了TVQP问题的拉格朗日函数

式(2)中:λ(t)∈Rm为拉格朗日乘子向量。

为了得到式(2)的最优解,Γ(x(t),λ(t),t)对x(t)和λ(t)的导数必须满足以下两个等式:

因此,上述等式可以重新表达为以下线性矩阵方程:

A(t)y(t)=B(t)。 (4)

式(4)中:

2 APZNN模型设计

为了求解式(4),定义误差函数

E(t)=A(t)y(t)-B(t)。 (5)

然后,ZNN的设计公式表达为

(·overE)(t)=-σ Φ(E(t))。 (6)

式(6)中:σ>0为一个收敛参数,用于调整ZNN模型的收敛速度; Φ(·):Rm×n→Rm×n为激活函数,通常这个激活函数是一个单调递增的奇函数。

式(6)中的σ是一个固定的值,在实际选择过程中需谨慎考虑这一因素:选择过小的值可能导致系统收敛速度过慢,而选择过大的值又可能会浪费计算资源。此外,有研究者指出,具有时变参数的模型比具有固定参数的模型收敛得更快。然而,时变参数会随时间的增大而不断地增大,导致计算资源的消耗增加。因此,将基于误差的自适应参数引入ZNN(APZNN)模型,该参数可以根据收敛过程中误差变化情况进行自适应的调整。其设计公式如下:

式(7)中:σ3=1/(r2(j-1))+1/(r1(1-k)); r1>0,r2>0,ρ>0; j>1; 0<k<1; Tp>0为一个预设收敛时间参数; ||·||2为二范数。增强符号双幂(enhanced sign-bi-power,ESBP)激活函数的表达式如下:

式(8)中:r1、r2、j、k的定义与之前相同; r3>0; φ(·)为Φ(·)中的一个元素。符号sign(ι)的定义如下:

结合式(5)、式(7)和式(8),可以得到APZNN模型为

3 理论分析3.1 稳定性分析

定理1 假设给出了光滑时变矩阵A(t)∈R(m+n)×(m+n)和光滑时变向量B(t)∈Rm+n,并且式(4)具有唯一解。对于任何初始向量y(0)∈Rm+n,APZNN模型(式(9))在李雅普诺夫意义上是渐进收敛的,状态解y(t)∈Rm+n收敛于理论解y*(t)∈Rm+n

证明:由式(5)导出,APZNN模型可转化为式(7)。为了便于分析,考虑它的第i个子系统得到了如下数学形式:

式(10)中:i∈{1,2,…,m+n}。构造一个李雅普诺夫函数

Li(t)=E2i(t)。 (11)

然后,同时取式(11)两边的时间导数:

式(12)中:2σ3/Tp>0; ρt||E(t)||2≥0,所以exp(ρt||E(t)||2≥0)≥1。φ(·)是单调递增奇函数,因此它满足以下性质:

因此,李雅普诺夫函数(式(12))的关系可以很容易地表示为

当Ei(t)=0时,系统已经趋于临界状态,因此不用讨论系统的稳定性。根据上述式子可以得到(·overL)i(t)<0总是成立的。根据李雅普诺夫稳定性定理,可以推断出APZNN模型的子系统是稳定的,即李雅普诺夫意义上的APZNN模型是渐进收敛的,状态解y(t)将收敛于理论解y*(t)。

3.2 收敛性分析

定理2 假设给出了光滑时变矩阵A(t)∈R(m+n)×(m+n)和光滑时变向量B(t)∈Rm+n,并且式(4)具有唯一解,则APZNN模型的||E(t)||2最终会在预设时间Tp内收敛到0。

证明:结合式(8)和式(12),可以得到以下公式:

为了便于证明,假设初始值|Ei(0)|>1。因此APZNN模型的收敛过程分为两步:第一,|Ei(t)|在ta时刻从|Ei(0)|下降至1; 第二,在ta+tb时刻下降至0。具体过程如下。

1)计算第一阶段时间ta。当|Ei(t)|>1时,r1|Ei(t)|k+1+r2|Ei(t)|j+1+r3E2i(t)的大小主要由r2|Ei(t)|j+1这一项来决定。因此,式(13)可以改写为

进一步可表示为

同时对式(15)两侧取积分:

2)计算第二阶段时间tb。当0≤|Ei(t)|<1时,r1|Ei(t)|k+1+r2|Ei(t)|j+1+r3E2i(t)的大小主要由r2|Ei(t)|k+1这一项来决定。因此,式(13)可以改写为

式(18)可以被转化成:

同样地,同时对式(19)两侧取积分:

已知σ3=1/(r2(j-1))+1/(r1(1-k)),收敛时间

基于上述计算和分析,可以得到APZNN模型在解决式(4)时,||E(t)||2在预设时间Tp内收敛到0,同时状态解y(t)也将收敛于理论解y*(t)。

3.3 鲁棒性分析

定理3 如果系统中存在时变的有界噪声Δh(t)∈Rm+n,则APZNN模型的||E(t)||2的收敛上界为,其中,μ为Δh(t)第i个子元素Δhi(t)的上界。

证明:当系统中存在有界噪声Δh(t)时,APZNN模型可以被重新表示为

根据式(5)可以将APZNN模型转换为式(7),进一步可以推导出:

考虑式(23)的第i个子系统,则

构建一个李雅普诺夫函数

取式(25)两边对时间的导数,可以推导出:

式(26)中:假设σ3|φ(Ei(t))|/Tp>|μ|,那么(·overg)i(t)<0。因为gi(t)=E2i(t)/2≥0,所以Ei(t)随着时间的增加而减少。当时间趋于无穷时,σ3|φ(Ei(t))|/Tp≤|μ|,进一步可以得到:

根据式(8)可知|φ(ι)|≥|r3ι|,那么|φ-1(ι)|≤|ι/r3|,故式(27)可以被转化为

误差范数||E(t)||2的上界为

4 仿真试验4.1 数值仿真

为了说明APZNN模型的优越性,引入ZNN模型和TVPZNN模型进行比较,具体见表1

表1 ZNN、TVPZNN和APZNN模型的比较
Table 1 Comparison between ZNN,TVPZNN and APZNN models

表1 ZNN、TVPZNN和APZNN模型的比较<br/>Table 1 Comparison between ZNN,TVPZNN and APZNN models

TVQP问题(式(1))的数值例子如下:

根据本文第一章的拉格朗日乘子法,将式(30)转换为线性矩阵方程:A(t)y(t)=B(t)。其中,y(t)=[x1(t),x2(t),λ(t)]T,A(t)、B(t)的具体值如下:

在仿真试验中,所有模型中的y(t)的初始值y(0)=[-1; 0.5; -0.5]。各个模型中的参数分别设置为:σ12=3; δ=1; δ0=0; ρ=2; r1=r2=r3=1; k=0.6; j=3。APZNN模型中的预定义收敛时间参数Tp设置为0.5 s。以下图中出现的=E(t)=2均表示误差函数E(t)=A(t)y(t)-B(t)的二范数。

图1展示了无噪声条件下各模型求解TVQP问题的状态解x(t)及理论解x*(t)的轨迹。从图1中可以看出APZNN模型的状态解能快速地收敛到理论解,是几个模型中最快的。

图1 无噪声条件下各模型求解TVQP问题的状态解x(t)及理论解x*(t)的轨迹<br/>Fig.1 Trajectory of state solution x(t)and theoretical solution x*(t)for TVQP problems solved by various models under noiseless conditions

图1 无噪声条件下各模型求解TVQP问题的状态解x(t)及理论解x*(t)的轨迹
Fig.1 Trajectory of state solution x(t)and theoretical solution x*(t)for TVQP problems solved by various models under noiseless conditions

图2展示了各模型求解TVQP问题的误差范数=E(t)=2的轨迹。通过观察图2(a)可知,在理想状态下,APZNN模型的误差在0.2 s左右时可以收敛到0,小于Tp的值。由于在理论证明过程中使用了缩放的方法,因此实际的收敛时间会短于Tp,这是合理的。从图2(b)可以看出:存在有界噪声Δhi(t)=0.2cost的情况下,APZNN模型有着很强的抗噪能力,能在最短时间内收敛; 而ZNN模型则受到了很大程度的影响,误差存在一定的波动。从图2误差曲线的变化情况可以明显看出,APZNN模型的鲁棒性最强。

图2 各模型求解TVQP问题的误差范数=E(t)=2的轨迹<br/>Fig.2 Trajectory of error norm =E(t)=2 for TVQP problems solved by various models

图2 各模型求解TVQP问题的误差范数=E(t)=2的轨迹
Fig.2 Trajectory of error norm =E(t)=2 for TVQP problems solved by various models

图3展示了不同Tp和不同初始值x(0)下APZNN模型的误差范数=E(t)=2的轨迹。从图3(a)中可以看出; 当预设时间Tp取不同值时,APZNN模型的误差总能在Tp之内收敛到0; 当Tp取0.2 s时,模型有着最快的收敛速度。图3(b)表明,对于3个不同的初始值x(0),APZNN模型有着相同的收敛速度,并且收敛时间都小于Tp。从图3可以看出,Tp。从图3可以看出,b>p可以预先设置模型的收敛时间上界,且收敛时间不受初始状态影响。

图3 不同Tp和不同初始值x(0)下APZNN模型的误差范数=E(t)=2的轨迹<br/>Fig.3 Trajectory of error norm =E(t)=2 of APZNN model under different Tp and different initial value x(0)

图3 不同Tp和不同初始值x(0)下APZNN模型的误差范数=E(t)=2的轨迹
Fig.3 Trajectory of error norm =E(t)=2 of APZNN model under different Tp and different initial value x(0)

为了更好地展示APZNN模型中基于误差的自适应收敛参数的优越性,我们将激活函数(式(8))应用到TVPZNN模型中,以便于接下来的对比。图4展示了TVPZNN模型和APZNN模型的误差范数=E(t)=2的轨迹及收敛参数的轨迹。由图4(a)可知,APZNN模型在预设时间内收敛,收敛时间小于TVPZNN模型。由图4(b)可知,TVPZNN模型的收敛参数随时间的增加而增加,在6 s时TVPZNN模型的收敛参数的值达到了1 200,这大大增加了计算负担。而APZNN模型的收敛参数在刚开始时处于一个较大的值,随着模型误差的收敛,慢慢地趋于一个较小的常值,这有利于减少资源的浪费。为了进一步推断TVPZNN模型和APZNN模型的计算资源的消耗,比较了它们在求解TVQP问题时的实际计算时间(表2)。从表2中可以看出,APZNN模型比TVPZNN模型的计算速度更快,当求解的问题更复杂时,这个差距会更大。

图4 TVPZNN模型和APZNN模型的误差范数=E(t)=2的轨迹及收敛参数的轨迹<br/>Fig.4 Trajectory of error norm =E(t)=2 and convergence parameter trajectory for TVPZNN and APZNN models

图4 TVPZNN模型和APZNN模型的误差范数=E(t)=2的轨迹及收敛参数的轨迹
Fig.4 Trajectory of error norm =E(t)=2 and convergence parameter trajectory for TVPZNN and APZNN models

表2 TVPZNN和APZNN模型的性能比较
Table 2 Performance comparison of TVPZNN and APZNN models

表2 TVPZNN和APZNN模型的性能比较<br/>Table 2 Performance comparison of TVPZNN and APZNN models

4.2 UR5机械臂路径跟踪

应用APZNN模型解决使用UR5机械臂跟踪四叶草路径的运动规划问题。在文献[18]中,一个基于TVQP的冗余机械臂重复运动规划方案被描述为

式(31)中:θ(t)∈R6,(·overθ)(t)∈R6分别为UR5机械臂的关节角度和关节角速度; q(t)=υ(θ(t)-θ(0)),υ>0为增益参数; f(·):R6→R3为非线性映射函数; 为雅可比矩阵; r(t)∈R3为末端执行器的期望路径向量;(·overr)(t)∈R3为末端执行器的期望速度向量; β>0为一个用于缩放位置反馈的常数参数。根据本文第一章的拉格朗日乘子法将式(31)转换为线性矩阵方程:A(t)y(t)=B(t),矩阵和向量的定义分别如下:

本仿真试验使用基于APZNN模型的逆运动学控制方法来控制UR5机械臂,以跟踪三维空间中的四叶草路径。APZNN模型中的参数与上述数值仿真试验中相同; υ=β=1; UR5机械臂的初始关节角度向量为θ(0)=[0,-π/2,-π/2,-π/3,π/2,0]T

采用APZNN模型控制UR5机械臂跟踪四叶草路径的仿真结果如图5所示。图5(a)为机械臂的末端执行器的期望路径和实际路径的轨迹,从中可以看出,末端执行器可以很好地跟踪期望的路径。末端执行器对应的3个方向上的位置误差如图5(b)所示,3个方向上的位置误差都被限制在-1.5×10-4 m和1.5×10-4 m之间,这也验证了本研究提出的APZNN模型的有效性。图5(c)和图5(d)分别展示了关节角度和关节角速度的变化曲线,从中可以看出变化曲线平滑,说明控制的过程相对稳定。

图5 采用APZNN模型控制UR5机械臂跟踪四叶草路径的仿真结果<br/>Fig.5 Simulation results of using APZNN model to control UR5 manipulator to track path of clover

图5 采用APZNN模型控制UR5机械臂跟踪四叶草路径的仿真结果
Fig.5 Simulation results of using APZNN model to control UR5 manipulator to track path of clover

5 结 语

本研究提出了一种求解TVQP问题的APZNN模型,引入了一个基于误差的自适应收敛参数,有效地解决了时变收敛参数过大的问题,且APZNN模型具有预设时间的收敛性。此外,理论分析还证明了APZNN模型的稳定性,预设时间收敛性和鲁棒性。同时,仿真试验结果表明,APZNN模型比ZNN模型和TVPZNN模型有着更优越的收敛性和更强的鲁棒性。最后,将APZNN模型应用于UR5机械臂的路径跟踪问题,其结果表明APZNN模型在解决工程实际问题中的有效性。本仿真试验的机械臂路径跟踪是基于MatLab平台的框架搭建,在未来,考虑将APZNN模型应用于真实的机械臂路径跟踪中。

参考文献