[论文解读] Probabilistic Safety Constraints for Learned High Relative Degree System Dynamics
本文提出了一种基于高斯过程回归的在线学习高相对阶系统动力学的概率安全框架。通过建模漂移项和输入增益项中的不确定性,利用控制屏障函数(CBF)形式化机会约束,以高概率确保安全,从而实现对复杂、欠驱动系统的自触发控制,并保证安全裕度。
This paper focuses on learning a model of system dynamics online while satisfying safety constraints.Our motivation is to avoid offline system identification or hand-specified dynamics models and allowa system to safely and autonomously estimate and adapt its own model during online operation.Given streaming observations of the system state, we use Bayesian learning to obtain a distributionover the system dynamics. In turn, the distribution is used to optimize the system behavior andensure safety with high probability, by specifying a chance constraint over a control barrier function.
研究动机与目标
- 实现无需依赖预先识别或手工指定动力学模型的自主在线系统辨识。
- 通过在系统动力学中引入不确定性,确保在线学习过程中的安全性。
- 将控制屏障函数(CBF)理论扩展至具有未知动力学和任意相对阶的系统。
- 推导一种自触发控制策略,以最小化控制更新频率,同时保持高概率安全性。
- 通过矩阵变量子高斯过程回归实现可扩展的概率安全约束,并采用高效的协方差分解。
提出的方法
- 使用矩阵变量子高斯过程回归,联合建模控制仿射系统中的漂移项 $f(\mathbf{x})$ 和输入增益 $g(\mathbf{x})$。
- 利用CBF的李导数表达安全条件,基于系统动力学的均值和方差进行表示。
- 通过在GP回归后验分布下对CBF条件施加机会约束,推导出概率安全约束。
- 引入一种自触发控制机制,计算在高概率下维持安全所需的最长控制更新间隔。
- 在GP中应用高效的协方差分解,以扩展至高维系统并降低计算成本。
- 通过仅基于CBF李导数的均值和方差表达安全条件,将框架扩展至任意相对阶系统。
实验结果
研究问题
- RQ1当真实动力学未知且动态演化时,如何确保在线学习系统动力学过程中的安全性?
- RQ2在高相对阶系统中,应如何对控制屏障函数进行适当的概率公式化,以考虑不确定性?
- RQ3能否推导出一种自触发控制策略,在最小化控制频率的同时保持高概率安全性?
- RQ4如何利用矩阵变量子高斯过程回归高效建模漂移项和输入增益项及其不确定性?
- RQ5在具有任意相对阶的系统中,为强制执行安全,所需的最少信息集(即李导数的均值和方差)是什么?
主要发现
- 所提方法利用贝叶斯GP回归实现高概率安全保证,支持安全的在线系统动力学学习。
- 该框架成功将CBF理论扩展至具有未知动力学和任意相对阶的系统,不再局限于相对阶为一的系统。
- 推导出自触发控制策略,基于后验不确定性计算最长安全控制更新间隔。
- 通过仅使用CBF李导数的均值和方差表达安全条件,实现可扩展的安全验证。
- 实验结果表明,该方法在模型不确定性下仍能以高概率维持安全,优于确定性CBF方法在不确定环境中的表现。
- 采用矩阵变量子高斯过程与协方差分解,实现高效计算,使该方法适用于高维系统。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。