QUICK REVIEW

[論文レビュー] Probabilistic Safety Constraints for Learned High Relative Degree System Dynamics

Mohammad Javad Khojasteh, Vikas Dhiman|arXiv (Cornell University)|Dec 20, 2019

Fault Detection and Control Systems参考文献 41被引用数 26

ひとこと要約

本稿では、ガウス過程回帰を用いて、オンラインで高相対次数系のダイナミクスを学習するための確率的セーフティフレームワークを提案する。ドリフト項と入力ゲイン項の不確実性をモデル化することで、制御バリア関数（CBF）を用いて確率的制約を定式化し、高い確率でセーフティを保証する。これにより、複雑でアンダーアクチュエーテッドなシステムにおいて、保証されたセーフティマージンを有する自己触発制御が可能になる。

ABSTRACT

This paper focuses on learning a model of system dynamics online while satisfying safety constraints.Our motivation is to avoid offline system identification or hand-specified dynamics models and allowa system to safely and autonomously estimate and adapt its own model during online operation.Given streaming observations of the system state, we use Bayesian learning to obtain a distributionover the system dynamics. In turn, the distribution is used to optimize the system behavior andensure safety with high probability, by specifying a chance constraint over a control barrier function.

研究の動機と目的

事前に特定されたり手動で指定されたダイナミクスモデルに依存せずに、自律的かつオンラインでのシステム同定を可能にすること。
システムダイナミクスの不確実性を組み込むことで、オンライン学習中にセーフティを保証すること。
未知のダイナミクスを有するシステムおよび任意の相対次数を有するシステムに、制御バリア関数（CBF）理論を拡張すること。
制御更新の頻度を最小限に抑えつつ、高い確率でセーフティを維持する自己触発制御ポリシーを導出すること。
行列変量GP回帰を用いたスケーラブルで確率的なセーフティ制約を提供すること。

提案手法

制御アフィン系におけるドリフト項 $f(\mathbf{x})$ と入力ゲイン $g(\mathbf{x})$ を同時にモデル化するために、行列変量ガウス過程回帰を用いる。
CBFのLie微分を用いて、システムダイナミクスの平均と分散に基づいてセーフティ条件を表現する。
GP回帰の事後分布を用いてCBF条件に確率的制約（チャンス制約）を課すことにより、確率的セーフティ制約を導出する。
セーフティを高い確率で維持するために必要な制御更新までの最長時間を計算する自己触発制御メカニズムを導入する。
GPにおける効率的な共分散因子分解を適用することで、高次元系へのスケーリングを図り、計算コストを低減する。
CBFのLie微分の平均と分散のみに依存する形で安全条件を表現することにより、任意の相対次数系にフレームワークを拡張する。

実験結果

リサーチクエスチョン

RQ1真のダイナミクスが未知で変化する状況において、オンライン学習中にどのようにセーフティを保証できるか。
RQ2高相対次数系において不確実性を考慮した適切な確率的CBFの定式化は何か。
RQ3制御頻度を最小限に抑えつつ、高い確率でセーフティを維持できる自己触発制御ポリシーをどのように導出できるか。
RQ4行列変量GP回帰を用いて、不確実性を伴うドリフト項と入力ゲイン項を効率的にモデル化する方法は何か。
RQ5任意の相対次数を持つシステムにおいてセーフティを強制するために必要な最小限の情報（Lie微分の平均と分散）は何か。

主な発見

提案手法により、確率的セーフティ保証を伴うベイジアンGP回帰を用いた安全なオンライン学習が可能になる。
フレームワークは、相対次数が1に限らない未知のダイナミクスを有するシステムに対しても、CBF理論を拡張し、成功裏に適用可能である。
後験分布に基づくポストリアの不確実性を考慮して、制御更新までの最長安全間隔を計算する自己触発制御ポリシーが導出された。
CBFのLie微分の平均と分散のみを用いて安全条件を表現することで、スケーラブルなセーフティ検証が実現された。
実験的結果から、モデル不確実性下でも高い確率でセーフティを維持でき、不確実な環境下では決定的CBFアプローチを上回ることを示した。
共分散因子分解を用いた行列変量GPの導入により、計算が効率的になり、高次元系への適用が可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。