QUICK REVIEW

[论文解读] Safe Nonlinear Control Using Robust Neural Lyapunov-Barrier Functions

Charles Dawson, Zengyi Qin|arXiv (Cornell University)|Sep 14, 2021

Advanced Control Systems Optimization参考文献 41被引用 27

一句话总结

该论文提出一个基于学习的框架，通过鲁棒控制李雅普诺夫屏障函数(rCLBFs)，在存在模型不确定性的情况下实现对非线性系统的安全性与稳定性的鲁棒控制器合成，从而支持实时基于QP的控制。仿真中在多样的安全控制任务上与鲁棒MPC相比具有较强鲁棒性。

ABSTRACT

Safety and stability are common requirements for robotic control systems; however, designing safe, stable controllers remains difficult for nonlinear and uncertain models. We develop a model-based learning approach to synthesize robust feedback controllers with safety and stability guarantees. We take inspiration from robust convex optimization and Lyapunov theory to define robust control Lyapunov barrier functions that generalize despite model uncertainty. We demonstrate our approach in simulation on problems including car trajectory tracking, nonlinear control with obstacle avoidance, satellite rendezvous with safety constraints, and flight control with a learned ground effect model. Simulation results show that our approach yields controllers that match or exceed the capabilities of robust MPC while reducing computational costs by an order of magnitude.

研究动机与目标

为非线性系统在模型不确定性下合成安全且稳定的控制器建立框架。
将控制李雅普诺夫屏障函数理论扩展到鲁棒（考虑不确定性）的情形（rCLBF）。
通过基于模型的学习使用神经网络学习鲁棒证书和控制器。
为安全关键任务提供一种基于证书的计算高效的鲁棒MPC替代方案。

提出的方法

定义鲁棒 CLBF（rCLBF），将 CLBF 扩展到有界参数不确定性，并推导基于 rCLBF 的 QP 控制器（rCLBF-QP）。
将动力学表示为对控可控的仿射形式，参数 θ 属于凸包 Θ，并对 θ 在凸包内强制鲁棒降低条件。
对 V 进行参数化并用神经网络的证明控制器 π_NN 进行参数化，离线训练，损失函数同时强制满足 CLBF 条件并确保 rCLBF-QP 的可行性。
在线使用 rCLBF-QP 通过求解带有来自 Lie 导数的 V 的约束的小型 QP 来计算安全控制。
在训练中，使用 V(x)=w(x)^T w(x) 来确保非负性，并通过 π_NN 估计 V 的时间导数以得到鲁棒降低项。
用神经网络验证工具或采样来验证学习得到的 V，并结合近似李雅普诺夫理论考虑到的稀疏违规区域。

实验结果

研究问题

RQ1一个统一的证书（rCLBF）是否能在有界模型不确定性下为非凸、非线性系统保证安全与稳定？
RQ2基于模型的学习得到的 rCLBF 是否能提供实时、鲁棒的安全保证，与鲁棒 MPC 相当，同时降低计算量？
RQ3rCLBF-QP 控制器在带有障碍物避免、非线性地面效应和非凸安全约束的任务中的表现如何？
RQ4神经证书在确保在线控制器的可行性和鲁棒性中扮演怎样的角色？

主要发现

基于 rCLBF 的控制器在参数不确定性下，对多种基准任务实现安全性和稳定性保证。
rCLBF-QP 控制器在笔记本硬件上实时运行（≈10 ms），相对于鲁棒 MPC 提供显著的加速（通常快一个数量级）。
在若干任务中，rCLBF-QP 与鲁棒 MPC 性能相当或更优，尤其当非线性动力学（如地面效应）显著时。
鲁棒 MPC 的性能对控制频率敏感，可能无法稳定非线性模型或非凸约束；而 rCLBF-QP 维持安全性和较为可靠的跟踪。
在各项基准测试中，安全率在报道处达到 100%，且评估时间显著低于鲁棒 MPC。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。