[论文解读] Learning for Safety-Critical Control with Control Barrier Functions
论文提出一个分段学习框架,用于学习影响控制屏障函数(CBFs)的模型不确定性,从而合成更安全的控制器,在仿真中的 Segway 和硬件上得到验证。
Modern nonlinear control theory seeks to endow systems with properties of stability and safety, and have been deployed successfully in multiple domains. Despite this success, model uncertainty remains a significant challenge in synthesizing safe controllers, leading to degradation in the properties provided by the controllers. This paper develops a machine learning framework utilizing Control Barrier Functions (CBFs) to reduce model uncertainty as it impact the safe behavior of a system. This approach iteratively collects data and updates a controller, ultimately achieving safe behavior. We validate this method in simulation and experimentally on a Segway platform.
研究动机与目标
- 在非线性系统中动量不确定性下的安全关键控制动机。
- 利用控制屏障函数(CBFs)强制前向安全不变性。
- 引入分段学习框架以学习未建模的动态如何影响CBF。
- 将数据驱动的CBF导数学习与基于优化的安全控制器结合起来。
- 通过仿真和硬件实验在 Segway 上证明有效性。
提出的方法
- 定义一个标称仿射在控动态模型和一个基于CBF的安全约束。
- 通过CBF时间导数中的未建模动态引入模型不确定性;学习包含从数据估计的 a 和 b 的 dot-h 修正项。
- 提出一个分段学习循环(类似 DAgger)以使用聚合数据逐步更新 CBF 导数估计器。
- 制定一个安全关键控制器(CBF-QP)和一个学习增强版本(LCBF-QP),后者使用学习到的 dot-h估计器。
- 使用神经网络近似不确定性项 a(x) 和 b(x),并以随情节变化的置信权重混合学习到的控制器与标称控制器。
- 在 Segway 平台上进行仿真与硬件上的数据采集与学习演示。
实验结果
研究问题
- RQ1动力学中的模型不确定性如何影响CBF的时间导数及安全性保证?
- RQ2分段学习框架能否准确学习未建模动力学对CBF的影响以维持安全性?
- RQ3将学习到的CBF 动力学整合到基于二次规划的控制器中,是否在不确定性下比基于模型的CBF控制器更安全?
- RQ4除了仿真,还能在物理平台(Segway)上进行实验验证吗?
主要发现
- 学习增强控制器(LCBF-QP)在仿真中对最多 15% 的参数扰动下仍能将状态维持在 CBf 安全集内。
- 带有 a(x) 和 b(x) 的神经网络估计的分段数据采集可降低安全违规并保持 h(x)≥0。
- 在 Ninebot Segway 上的实验演示显示,当对姿态角速率施加屏障时,安全性较基于模型的控制器有所提升。
- 在硬件测试中,随着信任权重的增加,混合学习和标称控制器带来显著的安全性提升。
- 该框架将数据驱动的CBF 动力学估计与基于优化的安全控制器联系起来,使在模型不确定性下的操作更安全。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。