Skip to main content
QUICK REVIEW

[論文レビュー] AGMA: Adaptive Gaussian Mixture Anchors for Prior-Guided Multimodal Human Trajectory Forecasting

Chao Li, Rui Zhang|arXiv (Cornell University)|Feb 4, 2026
Autonomous Vehicle Technology and Safety被引用数 0
ひとこと要約

AGMA は Gaussian mixture アンカーのバッチごとのクラスタリングとグローバル蒋 distillation によって表現力豊かでシーン適応型の priors を作成し、マルチモーダル軌道予測の改善と複数のベンチマークで最先端の結果を実現します。

ABSTRACT

Human trajectory forecasting requires capturing the multimodal nature of pedestrian behavior. However, existing approaches suffer from prior misalignment. Their learned or fixed priors often fail to capture the full distribution of plausible futures, limiting both prediction accuracy and diversity. We theoretically establish that prediction error is lower-bounded by prior quality, making prior modeling a key performance bottleneck. Guided by this insight, we propose AGMA (Adaptive Gaussian Mixture Anchors), which constructs expressive priors through two stages: extracting diverse behavioral patterns from training data and distilling them into a scene-adaptive global prior for inference. Extensive experiments on ETH-UCY, Stanford Drone, and JRDB datasets demonstrate that AGMA achieves state-of-the-art performance, confirming the critical role of high-quality priors in trajectory forecasting.

研究の動機と目的

  • マルチモーダル軌道予測における高品質 priors の重要性を動機づける。
  • priors を明示的に最適化する二段階フレームワークを提案する:バッチ priors 抽出とグローバル priors 蒋 distillation。
  • priors の質を向上させると予測誤差が低下し、分布適合が改善されることを示す。
  • ETH-UCY、Stanford Drone、JRDB データセットで最先端の性能を示す。

提案手法

  • priors を適応的ガウス混合アンカー(GMM)として定式化する。
  • Stage 1: バッチ priors 抽出をグラフベースのクラスタリングで実施し、各トレーニングバッチ内の多様な行動パターンを発見し、バッチレベルの GMM として符号化する。
  • Stage 2: クロスアテンションを介してバッチ GMM を文脈条件付きのグローバル GMM に写像する最適輸送を用いたグローバル priors 蒋 distillation。
  • prior の質を示すだけでデコーダの複雑さではなく、シンプルな共有 MLP デコーダを用いて性能を示す。
  • clustering の質を強調する損失(L_B)、ガイダンスの直接監督(L_G)、蒋 distillation の整合性(L_distill)を重視した損失で訓練する。
  • テスト時のサンプリングは文脈条件付きグローバル priors を クロスアテンションで用いて多様な予測を生成する。
Figure 1 : Qualitative comparison of priors at a three-way intersection with two agents: (a) Implicit Gaussian priors: Simple Gaussian priors collapse to a single dominant mode during training, yielding limited diversity. (b) Discrete anchor priors: Fixed discrete priors produce repetitive predictio
Figure 1 : Qualitative comparison of priors at a three-way intersection with two agents: (a) Implicit Gaussian priors: Simple Gaussian priors collapse to a single dominant mode during training, yielding limited diversity. (b) Discrete anchor priors: Fixed discrete priors produce repetitive predictio

実験結果

リサーチクエスチョン

  • RQ1 priors の質を向上させることは軌道予測の精度と分布適合を直接高めるか?
  • RQ2 バッチクラスタリングとグローバル distillation による explicit priors 最適化は priors の不整合を緩和し、より良いマルチモーダル予測をもたらすか?
  • RQ3 AGMA は priors の力を示すために、シンプルなデコーダと priors 学習のバランスをどうとるか?

主な発見

  • AGMA は ETH-UCY において、複雑なデコーダを用いた手法と比較して競争力があり、最先端の性能を示す。
  • ETH-UCY では、AGMA は mADE 20 で 5.26% の改善、mFDE 20 で 9.38% の改善を達成。
  • ETH-UCY、SDD、JRDB 全体で一貫した改善を示し、高品質 priors の優位性を検証。
  • Ablation では L_G を除くと最大の性能低下が生じ、グローバル priors の直接監督の必須性を強調。
  • バッチサイズの効果は、より細かなバッチ分割が局所 priors をよりよく捉え、グローバル分布の過度な平滑化を防ぐことを示す。
  • Top-K サンプリングを増やすと性能が引き続き向上し、学習された priors が意味のある多様なパターンを符号化しモード崩壊を回避していることを示す。
Figure 2 : AGMA architecture. Left: Graph-based clustering discovers behavioral patterns within each batch, forming batch-level GMM priors. Right: Optimal transport distills batch priors into a global GMM, refined via trajectory prediction with a shared decoder.
Figure 2 : AGMA architecture. Left: Graph-based clustering discovers behavioral patterns within each batch, forming batch-level GMM priors. Right: Optimal transport distills batch priors into a global GMM, refined via trajectory prediction with a shared decoder.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。