QUICK REVIEW

[論文レビュー] Scenario Diffusion: Controllable Driving Scenario Generation With Diffusion

Ethan Pronovost, Meghana Reddy Ganesina|arXiv (Cornell University)|Nov 5, 2023

Autonomous Vehicle Technology and Safety被引用数 8

ひとこと要約

本論文はScenario Diffusionという拡散ベースのモデルを導入し、地図と記述トークンで条件付けを行い、車両の向き付き境界ボックスと軌跡を同時に生成する。これにより、自動運転車の安全性検証のための controllable で地理的に一般化可能なシナリオ作成を実現する。

ABSTRACT

Automated creation of synthetic traffic scenarios is a key part of validating the safety of autonomous vehicles (AVs). In this paper, we propose Scenario Diffusion, a novel diffusion-based architecture for generating traffic scenarios that enables controllable scenario generation. We combine latent diffusion, object detection and trajectory regression to generate distributions of synthetic agent poses, orientations and trajectories simultaneously. To provide additional control over the generated scenario, this distribution is conditioned on a map and sets of tokens describing the desired scenario. We show that our approach has sufficient expressive capacity to model diverse traffic patterns and generalizes to different geographical regions.

研究の動機と目的

自動運転車の多様で安全性に関わる交通シナリオの自動生成を動機づける。
エージェントの位置、向き、軌跡を出力する制御可能な拡散ベースのフレームワークを開発する。
地図とシナリオトークンで条件付けを行い生成シーンを操縦可能にする。
地理的領域の違いとトークンベースの制御で一般化を示す。
部分的なトークン化でラベリング要件を削減しつつ制御性を維持する。

提案手法

シーンを潜在空間へ写像するVAE風オートエンコーダと、その潜在空間で動作する拡散モデルという二部構成を採用。
BEV入力からア anch orフリー検出を行い、 oriented bounding boxes と軌跡を検出するようオートエンコーダを訓練。
地図データとトークンで条件付けられた潜在表現をノイズ除去する条件付き拡散モデル（EDMベース）を訓練し、推論時には逆時ODEを用いる。
拡散UNetに encoded map features を latent tokens と連結して地図条件付けを組み込む。
二つのトークン条件付け方式をサポートする：エージェントトークン（各エージェントの記述特徴）とグローバルシーントークン（全体シーン特性を制御）。
訓練時にトークンをマスクして部分的なトークン化を検討し、提供トークンを超える追加エージェントの生成を学習する。

実験結果

リサーチクエスチョン

RQ1拡散ベースの生成は地図と高レベルのトークンで条件付けされた現実的で多様な運転シナリオを生成できるか。
RQ2トークン条件付けは完全な軌跡指定なしでエージェントの挙動とシーン構成を制御可能にするか。
RQ3モデルは異なる地理的地域間でシナリオ分布をどれほどうまく一般化できるか。
RQ4部分的なトークン化はラベリングを削減しつつ制御性を維持するのに sufficient か。

主な発見

Method	MMD 2 Positions ( ↓ )	MMD 2 Headings ( ↓ )	MMD 2 Velocity ( ↓ )	Traj On Drivable	Lane Heading Difference
Ground Truth Log	-	-	-	0.900 (0.000)	0.203 (0.000)
Random Log Selection	0.142 (0.001)	0.386 (0.001)	0.104 (0.001)	0.407 (0.001)	1.497 (0.004)
TrafficGen [ 6 ] Placement Model	0.113 (0.002)	0.124 (0.003)	0.054 (0.002)	-	-
Scenario Diffusion (No Map)	0.142 (0.006)	0.352 (0.012)	0.091 (0.007)	0.411 (0.009)	1.504 (0.004)
Scenario Diffusion	0.093 (0.006)	0.108 (0.007)	0.055 (0.003)	0.895 (0.008)	0.271 (0.017)

Scenario Diffusionは地図条件付け時にエージェントの位置・向き分布のMMDを低減し、真の軌跡品質に近づく。
モデルは走行可能領域の整合性と車線一貫性の高い挙動を維持する Plausible な軌跡を保つ。
トークン条件付けにより、完全な軌跡指定なしでAVと他エージェント間の対象的な相互作用を制御可能にする。
部分的トークン化はエージェント・トークンの一致率を高く保ちつつ、グローバルトークンに比例して追加エージェントを生成可能にする（一致率約0.97程度）。
複数地域で訓練したモデルは unseen region へより良く一般化し、全地域訓練は地域特化モデルに近い性能を達成する。
境界ボックスと軌跡を同時にモデリングすることで、トークンで記述された将来挙動に駆動されるエージェント間の一貫した相互作用を実現する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。