QUICK REVIEW

[論文レビュー] Synthesis of safe controller via supervised learning for truck lateral control.

Yuxiao Chen, Ayonga Hereid|arXiv (Cornell University)|Dec 15, 2017

Vehicle Dynamics and Control Systems参考文献 24被引用数 4

ひとこと要約

本稿では、アーティキュレートトレックの横方向制御のためのハイブリッド制御器を提案する。この制御器は、教師あり学習と制御バリア関数（CBF）を組み合わせることで、安全保証付きの高パフォーマンスを達成する。最適化された軌道にCBF制約を組み込んだデータセットを用いてポリシーを教師あり学習で訓練し、その後、CBFに基づく監視器を用いて安全性を保証する。その結果、レーンキーピングの事例において監視器の干渉が最小限に抑えられる。

ABSTRACT

Correct-by-construction techniques such as control barrier function (CBF) have been developed to guarantee safety for control systems as supervisory controller. However, when the supervisor intervenes, the performance is typically compromised. On the other hand, machine learning is used to synthesize controllers that inherit good properties from the training data, but safety is typically not guaranteed due to the difficulty of analysis. In this paper, supervised learning is combined with CBF to synthesize controllers that enjoy good performance with safety guarantee. First, a training set is generated by trajectory optimization that incorporates the CBF constraint for multiple initial conditions. Then a policy is trained via supervised learning that maps the feature representing the initial condition to a parameterized desired trajectory. Finally, the learning based controller is used as the student controller, and a CBF based supervisory controller on top of that guarantees safety. A case study of lane keeping for articulated trucks shows that the student controller trained by the supervised learning inherits the good performance of the training set and the CBF supervisor never or rarely intervenes.

研究の動機と目的

自律走行車両制御におけるパフォーマンスと安全性のトレードオフを、アーティキュレートトレックのような複雑なシステムに対して解決すること。
安全性の保証がない純粋な学習ベースの制御器の限界を克服し、干渉によってパフォーマンスが低下する純粋なCBFベースの監視器の限界も克服すること。
学習ベースの制御器のパフォーマンスを活かしつつ、CBFベースの監視レイヤーによって安全性を保証するフレームワークを構築すること。
実世界の制御シナリオであるアーティキュレートトレックのレーンキーピングにおいて、本手法の有効性を実証すること。

提案手法

制御バリア関数（CBF）制約を組み込んだ複数の初期状態における軌道最適化問題を解くことで、学習用データセットを生成する。
初期状態の特徴量をパラメータ化された望ましい軌道にマッピングする教師ありポリシーを訓練し、最適化された軌道から学習する。
訓練されたポリシーを生徒制御器として実装し、学習された望ましい軌道に従うように動作させる。
生徒制御器の上に、リアルタイムで安全性制約を強制するCBFベースの監視制御器を実装する。
生徒制御器の軌道が安全性条件を満たさない場合にのみ、監視器が干渉することを保証する。
CBFフレームワークを用いて数学的に安全性を保証しつつ、安全な状態では生徒制御器が自由に動作できるようにする。

実験結果

リサーチクエスチョン

RQ1教師あり学習ベースの制御器は、CBF制約付き最適軌道のデータセットから、高いパフォーマンスを継承できるか？
RQ2生徒制御器を閉ループで使用した場合、CBFベースの監視器が干渉頻度をどの程度低減できるか？
RQ3教師あり学習とCBFの統合は、従来のCBFのみのアプローチに比べて安全性の保証を維持しながらパフォーマンスを向上させられるか？
RQ4本手法は、アーティキュレートトレックの実世界の横方向制御タスク（例：レーンキーピング）において、どの程度の性能を示すか？

主な発見

教師あり学習で訓練された生徒制御器は、学習に用いた最適化された軌道のパフォーマンス特性を正確に再現できた。
CBFベースの監視制御器は、レーンキーピング作業中、ほとんどまたは全く干渉しなかった。これは、高い信頼性とパフォーマンスの低下の最小化を示している。
学習とCBFの統合により、許容可能な軌道の境界付近でも安全性が保証された。
本手法により、CBF監視器を追加することで、学習ベースの制御器が安全性を損なわず高パフォーマンスを達成できることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。