[論文レビュー] Map-Adaptive Goal-Based Trajectory Prediction
GoalNet はマップ由来のゴール経路を提案し、ゴールベースとモーションベースのモードをグラフネットワークでモデル化することで、多_MODALで長期の車両軌跡を予測します。任意のマップ幾何に適応し、internal および nuScenes データセットのベースラインを上回ります。
We present a new method for multi-modal, long-term vehicle trajectory prediction. Our approach relies on using lane centerlines captured in rich maps of the environment to generate a set of proposed goal paths for each vehicle. Using these paths -- which are generated at run time and therefore dynamically adapt to the scene -- as spatial anchors, we predict a set of goal-based trajectories along with a categorical distribution over the goals. This approach allows us to directly model the goal-directed behavior of traffic actors, which unlocks the potential for more accurate long-term prediction. Our experimental results on both a large-scale internal driving dataset and on the public nuScenes dataset show that our model outperforms state-of-the-art approaches for vehicle trajectory prediction over a 6-second horizon. We also empirically demonstrate that our model is better able to generalize to road scenes from a completely new city than existing methods.
研究の動機と目的
- 高精度マップの車線中心線を用いてアクターのゴールを推測し、長期軌道予測を行う。
- 任意の車線トポロジーを扱える可変数のゴールを用いたマップ適応フレームワークを開発する。
- ゴールベースの軌道モードとモーションベースの軌道モードを統合して、適合的および非適合的な運転行動の両方を捉える。
- 道の幾何やシーン間での一般化を改善するため、パス相対座標系を採用する。
提案手法
- 各アクターに対して探索半径内の車線中心線から可変数のゴール経路を生成する。
- アクター状態、経路沿いの文脈、およびゴール経路をエンコーダとパス整列ラスターで符号化する。
- 1つのアクターノードと複数のゴールノードを持つグラフネットワークを用いて、各ゴールに紐づく軌道を予測する。
- 出力をパス相対フレームで表現し、走査軸とクロス軸の成分を分離する。
- ゴールベースおよびゴールフリー(モーションベース)軌道モードで、空間的・時間的な多様性をモデル化する。
- モードの分類損失と軌道成分の回帰損失を組み合わせたジョイント損失で訓練する。
実験結果
リサーチクエスチョン
- RQ1マップ由来のゴール経路は、各アクターにとってコンパクトで解釈可能なマルチモーダル予測を提供できるか。
- RQ2マップ適応型のセットベース予測フレームワークは、長期的な精度と新都市への一般化を改善するか。
- RQ3ゴールベースとモーションベースのモードを統合することは、予測カバレッジとエラーメトリクスにどのような影響を与えるか。
- RQ4パス相対フレームが、さまざまな道路幾何に対する学習と一般化に与える影響は何か。
主な発見
| Method | Dataset | Min1ADE | Min1FDE | Min3ADE | Min3FDE | Min5ADE | Min10ADE | E_ADE |
|---|---|---|---|---|---|---|---|---|
| MTP | internal | 2.67 (2.77) | 7.08 (7.65) | 1.69 (2.10) | 4.36 (5.92) | 1.69 (2.10) | 1.69 (2.10) | 2.98 (2.82) |
| MTP | nuScenes | — | — | — | — | — | — | — |
| MultiPath | internal | 2.91 (4.01) | 7.69 (10.39) | 1.78 (2.40) | 4.61 (6.24) | 1.44 (1.85) | 1.14 (1.35) | 3.33 (4.13) |
| MultiPath | nuScenes | — | — | — | — | — | — | — |
| CoverNet | nuScenes | — | — | — | — | — | — | — |
| GoalNet-1T | internal | 2.27 (2.13) | 5.90 (5.79) | 1.86 (1.77) | 4.70 (4.75) | 1.80 (1.75) | 1.79 (1.75) | 2.35 (2.18) |
| GoalNet-1T | nuScenes | 1.99 (1.46) | — | — | — | — | — | — |
| GoalNet-2T | internal | 2.53 (2.44) | 6.57 (6.63) | 1.53 (1.41) | 3.83 (3.66) | 1.34 (1.27) | 1.28 (1.22) | 2.79 (2.60) |
| GoalNet-2T | nuScenes | — | — | — | — | — | — | — |
- GoalNet は internal および nuScenes データセットで複数の指標において最先端の性能を達成した。
- GoalNet-1T(空間モードごとの1つの時間モード)および GoalNet-2T(2つの時間モード)は有力な結果を示し、GoalNet-2T はほとんどの指標で優れることが多い。
- モデルは可変数の軌道モードを使用し、シーンの幾何に適応して固定軌道セットの過度な必要性を減らす。
- 長期的な予測でクロス・トラック誤差が大幅に低減される傾向があり、長期予測の利点を示す。
- 都市間一般化の結果、未知の都市でテストした場合に GoalNet がベースラインより劣化が小さいことから、マップ適応型の構成的帰納バイアスを示す。
- アブレーションにより、パスラスターとパス相対投影がATE/CTEおよび全体の予測品質の向上に寄与することが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。