Skip to main content
QUICK REVIEW

[论文解读] Stable Model-based Control with Gaussian Process Regression for Robot Manipulators

Thomas Beckers, Jonas Umlauft|arXiv (Cornell University)|Sep 18, 2019
Advanced Control Systems Optimization参考文献 19被引用 24
一句话总结

本文提出了一种稳定、基于数据的计算力矩控制律,用于机器人机械臂,采用高斯过程回归(GPR)建模未建模的动力学。通过利用GPR学习近似机器人模型与真实动力学之间的差异,该方法在训练数据增加时确保了跟踪误差的随机有界性与渐近稳定性,仿真和真实世界实验中对柔性机械臂任务的表现优于经典计算力矩控制和高增益PD控制。

ABSTRACT

Computed-torque control requires a very precise dynamical model of the robot for compensating the manipulator dynamics. This allows reduction of the controller's feedback gains resulting in disturbance attenuation and other advantages. Finding precise models for manipulators is often difficult with parametric approaches, e.g. in the presence of complex friction or flexible links. Therefore, we propose a novel computed-torque control law which consists of a PD feedback and a dynamic feed forward compensation part with Gaussian Processes. For this purpose, the nonparametric Gaussian Process regression infers the difference between an estimated and the true dynamics. In contrast to other approaches, we can guarantee that the tracking error is stochastically bounded. Furthermore, if the number of training points tends to infinity, the tracking error is asymptotically stable in the large. In simulation and with an experiment, we demonstrate the applicability of the proposed control law and that it outperforms classical computed-torque approaches in terms of tracking precision.

研究动机与目标

  • 解决机器人机械臂在复杂非线性特性(如摩擦和柔性连杆)下精确动力学建模的挑战。
  • 克服参数化模型对精确物理参数的依赖性及其在结构不确定性下的失效问题。
  • 开发一种无需依赖高反馈增益的、保证稳定性和收敛性的数据驱动控制律。
  • 通过非参数GPR学习未建模动力学,实现安全、低增益控制,同时保持高跟踪精度。
  • 在有限训练数据条件下,为跟踪误差的随机有界性和渐近稳定性提供理论保证。

提出的方法

  • 在轨迹数据上训练高斯过程(GP),以建模名义机器人动力学模型与真实动力学之间的差异。
  • 控制律结合了低增益PD反馈与基于GPR的动态前馈项,以补偿模型误差。
  • GP使用平方指数协方差函数,其超参数通过在训练数据上进行似然最大化进行优化。
  • 通过仅依赖位置和速度反馈,避免了对关节加速度的直接反馈,后者通常噪声大且难以测量。
  • 采用基于李雅普诺夫的分析证明稳定性,表明跟踪误差围绕零点保持随机有界。
  • 随着训练样本数量的增加,误差界缩小,从而在大范围内实现渐近稳定性。

实验结果

研究问题

  • RQ1基于非参数GPR的前馈补偿是否能提升存在未建模动力学的机器人机械臂的跟踪性能?
  • RQ2所提出的控制律是否无论训练数据规模如何,都能保证跟踪误差的随机有界性?
  • RQ3在存在非线性的现实场景中,GPR-based控制器与经典计算力矩控制和高增益PD控制相比表现如何?
  • RQ4增加训练数据对跟踪误差收敛性和准确性的有何影响?
  • RQ5该方法能否在低反馈增益下实现高精度控制,避免执行器饱和和噪声放大?

主要发现

  • 所提出的CT-GP控制器在仿真和实验中均实现了比所有低增益控制器(LG-PD、CT、CT-SP)更低的RMSE,并与高增益PD(HG-PD)控制器表现相当。
  • 在实验中,CT-GP控制器的反馈增益相比高增益基线降低了40倍,同时保持了相似的跟踪精度。
  • 第一关节的RMSE从CT的0.15 rad降低至CT-GP的0.05 rad,第二关节从CT的0.12 rad降低至CT-GP的0.07 rad,显示出显著改进。
  • 图9中的学习曲线表明,训练样本从100增加到400时,RMSE降低了约50%,证实了数据效率。
  • CT-GP的力矩剖面与高增益控制器(HG-PD)非常接近,表明在不使用高反馈增益的情况下实现了有效的动态补偿。
  • 理论分析证实,当训练数据趋于无穷时,跟踪误差保持随机有界且在大范围内渐近稳定。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。