Skip to main content
QUICK REVIEW

[論文レビュー] Bayesian Inverse Games with High-Dimensional Multi-Modal Observations

Yash Jain, X. X. Liu|arXiv (Cornell University)|Jan 2, 2026
Gaussian Processes and Bayesian Inference被引用数 0
ひとこと要約

本論文は、分解可能な変分自己符号化器と微分可能な Nash ソルバーを用いて、多様な軌跡と画像から多峰性の対戦相手の意図を推定する、扱いやすいベイズ逆ゲームフレームワークを紹介し、不確実性を伴う安全なリアルタイム計画を実現する。

ABSTRACT

Many multi-agent interaction scenarios can be naturally modeled as noncooperative games, where each agent's decisions depend on others' future actions. However, deploying game-theoretic planners for autonomous decision-making requires a specification of all agents' objectives. To circumvent this practical difficulty, recent work develops maximum likelihood techniques for solving inverse games that can identify unknown agent objectives from interaction data. Unfortunately, these methods only infer point estimates and do not quantify estimator uncertainty; correspondingly, downstream planning decisions can overconfidently commit to unsafe actions. We present an approximate Bayesian inference approach for solving the inverse game problem, which can incorporate observation data from multiple modalities and be used to generate samples from the Bayesian posterior over the hidden agent objectives given limited sensor observations in real time. Concretely, the proposed Bayesian inverse game framework trains a structured variational autoencoder with an embedded differentiable Nash game solver on interaction datasets and does not require labels of agents' true objectives. Extensive experiments show that our framework successfully learns prior and posterior distributions, improves inference quality over maximum likelihood estimation-based inverse game approaches, and enables safer downstream decision-making without sacrificing efficiency. When trajectory information is uninformative or unavailable, multimodal inference further reduces uncertainty by exploiting additional observation modalities.

研究の動機と目的

  • 非協力ゲームにおける未知の相手の目的を多モーダル観測から推定する。
  • ベイズ後方分布を介して推定ゲームパラメータの不確実性を定量化する。
  • 多モーダルデータを用いてリアルタイムで安全性を意識したダウンストリーム計画を実現する。
  • MLEベースの逆ゲームアプローチよりも推論と計画性能の改善を示す。

提案手法

  • 逆ゲームをパラメトリック一般化 Nash均衡を用いたゲームパラメータのベイズ推論として定式化する。
  • 対戦相手の意図に関する生成的ベ beliefsモデルを学習するために、変分自己符号化器内に微分可能な Nashゲームソルバーを組み込む。
  • 軌跡観測をゲームソルバーの平衡結果に条件づけたガウス尤度でモデル化する。
  • 潜在変数モデルを導入し、潜在 z がゲームパラメータ theta と画像平均に写像されることで、多モーダルデータを融合可能とする。
  • KKT条件の暗黙微分を用いてゲームソルバーを経て誤差逆伝播することで、アマルタイズドELBO目的で訓練する。
  • ガウス代替 q(z|y) を用いて潜在変数の後方分布を近似し、theta|y のサンプリングを可能にする。

実験結果

リサーチクエスチョン

  • RQ1逆ゲームにおいて、軌跡と画像という多モーダル観測から未知のゲームパラメータの後方分布を推定するにはどうすれば良いか。
  • RQ2高次元の視覚観測を取り入れると、不確実性が低減し、軌跡のみの場合と比較してダウンストリームの計画安全性が向上するか。
  • RQ3提案するフレームワークは多モーダルの後方分布を捉え、真の目的に対するラベルを要求せずリアルタイムで動作できるか。
  • RQ4訓練中に埋め込まれた微分可能な Nashソルバーをどのように勾配伝搬させるか。
  • RQ5現実的なシミュレーションにおける多モーダルデータが推論品質と計画性能に与える影響はどの程度か。

主な発見

  • フレームワークは対戦相手の意図に関する事前分布と事後分布を学習し、MLEベースの逆ゲームアプローチより推論品質を向上させる。
  • 軌跡情報が情報量不足または不在の場合に、多モーダル観測は不確実性を低減する。
  • リアルタイム動作で安全なダウンストリーム意思決定を可能にしつつ、効率を犠牲にしない。
  • 微分可能な Nashソルバーを埋め込むことで、エンドツーエンド訓練の解釈可能で扱いやすい勾配を提供する。
  • CARLAでの実験は、視覚情報と部分状態観測を組み合わせることで逆ゲーム推論の利点があることを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。