QUICK REVIEW

[論文レビュー] Deep Imitation Learning for Autonomous Driving in Generic Urban Scenarios with Enhanced Safety

Jianyu Chen, Bodi Yuan|arXiv (Cornell University)|Mar 2, 2019

Autonomous Vehicle Technology and Safety参考文献 27被引用数 32

ひとこと要約

本論文は，未来の軌道を予測するために鳥瞰ビュー入力を用いた都市走行の深層模倣学習フレームワークを提示する。シミュレーションの安全なテスト時動作を保証するため、セーフセット理論に基づくセーフティコントローラを強化している。

ABSTRACT

The decision and planning system for autonomous driving in urban environments is hard to design. Most current methods manually design the driving policy, which can be expensive to develop and maintain at scale. Instead, with imitation learning we only need to collect data and the computer will learn and improve the driving policy automatically. However, existing imitation learning methods for autonomous driving are hardly performing well for complex urban scenarios. Moreover, the safety is not guaranteed when we use a deep neural network policy. In this paper, we proposed a framework to learn the driving policy in urban scenarios efficiently given offline connected driving data, with a safety controller incorporated to guarantee safety at test time. The experiments show that our method can achieve high performance in realistic simulations of urban driving scenarios.

研究の動機と目的

ハンドクラフトされたポリシーを用いず、都市部自動運転の意思決定と計画の学習を動機づける。
サンプル効率と一般化を向上させる鳥瞰ビュー観測表現を提案する。
オフラインの専門家データから計画軌道を予測する深層ポリシーを学習する。
将来の障害物の運動を予測せずにテスト時の安全を保証するセーフティコントローラを組み込む。

提案手法

HDマップ、ルーティング、信号、過去の物体、過去の自車状態をエンコードする鳥瞰ビュー入力を使用する。
直接的な制御コマンドの代わりに、ホライズンHにわたる計画軌道を出力する。
鳥瞰ビュー入力を軌道点へマッピングするCNN（VGG様）を用い、変位ベースの損失で訓練する。
データ収集時にノイズを注入して共変量シフトを低減することでデータを増強する。
安全集合理論に基づくセーフティコントローラを統合し、プランナー出力を二次計画法を介して安全な制御集合へ射影する。

実験結果

リサーチクエスチョン

RQ1オフラインの都市走行データからの模倣学習は、汎用的な都市シナリオに対して高性能なポリシーを生み出せるか。
RQ2鳥瞰ビュー表現はサンプル複雑さを低減し、都市レイアウト間の一般化を改善するか。
RQ3障害物の軌道予測を必要とせず、テスト時の安全を保証するためにセーフティコントローラを組み込むことは有効か。
RQ4データ拡張は閉ループ性能と摂動からの回復にどう影響するか。

主な発見

課題	M0	M1	M2
Intersection	16%	96%	100%
Roundabout	12%	84%	96%

データ拡張とセーフティコントローラを組み込んだ最終モデルは、交差点と円形交差点の試験でほぼ完璧な成功を達成した（Intersection: 100%; Roundabout: 96%）。
オープンループの変位誤差は、拡張と安全コンポーネントを備えた場合、非拡張ベースラインと比較して改善される（新しい町でベースモデルの0.16 m対0.44 mなど）。
セーフティコントローラはより安全な挙動を保証し、Town03とTown01における他の学習ベース手法と比較して違反（車線逸脱・衝突）を減少させる。
データ拡張は異常状態からの回復を著しく改善し、複雑な都市シナリオにおけるポリシーの堅牢性を高める。
このアプローチは閉ループCARLA実験において、モジュラーパイプラインや他の学習法と比較して競争力がある、あるいは優れている性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。