[論文レビュー] IntentReact: Guiding Reactive Object-Centric Navigation via Topological Intent
IntentReact は、コンパクトな 2-hop トポロジカルインテントを用いてローカルポリシーをバiasし、実行をグローバルなトポロジカル進行と整合させる、意図 conditioned のオブジェクト中心ナビゲーションフレームワークを導入する。実現性精錬 BEV モジュールが補助。
Object-goal visual navigation requires robots to reason over semantic structure and act effectively under partial observability. Recent approaches based on object-level topological maps enable long-horizon navigation without dense geometric reconstruction, but their execution remains limited by the gap between global topological guidance and local perception-driven control. In particular, local decisions are made solely from the current egocentric observation, without access to information beyond the robot's field of view. As a result, the robot may persist along its current heading even when initially oriented away from the goal, moving toward directions that do not decrease the global topological distance. In this work, we propose IntentReact, an intent-conditioned object-centric navigation framework that introduces a compact interface between global topological planning and reactive object-centric control. Our approach encodes global topological guidance as a low-dimensional directional signal, termed intent, which conditions a learned waypoint prediction policy to bias navigation toward topologically consistent progression. This design enables the robot to promptly reorient when local observations are misleading, guiding motion toward directions that decrease global topological distance while preserving the reactivity and robustness of object-centric control. We evaluate the proposed framework through extensive experiments, demonstrating improved navigation success and execution quality compared to prior object-centric navigation methods.
研究の動機と目的
- 部分観測下でのグローバルなオブジェクトレベルのトポロジカル計画と局所的な知覚駆動制御のギャップを埋める。
- グローバル計画ガイダンスをコンパクトな 2-hop トポロジカルインテント信号としてエンコードする。
- FiLM による学習済みウェイポイント予測コントローラを条件付け、トポロジー的一貫した進行へ動作をバiasする。
- BEV ベースの実現可能性精錬モジュールで実行の頑健性を向上させる。
- 従来のオブジェクト中心手法より、ナビゲーションの成功と効率の向上を実証する。
提案手法
- オブジェクトレベルのトポロジカルマップ(3D 座標と連結性を持つオブジェクトノードのグラフ)を構築する。
- オンライン実行時に Dijkstra 法でクエリオブジェクトからゴールへの最短経路を計算する。
- グローバル経路から 2-hop のインテント方向を導出し、次の距離が減少するノードへ向かうロボットフレーム内の単位ベクトルとして表現する。
- FiLM(gamma, beta は 2-hop インテントから生成)によってインテントをウェイポイント予測コントローラへ条件付けする。
- 予測ウェイポイントを BEV 通行性マップに投影して幾何学的実現可能性を確保する(必要に応じて最も近い実現可能な射影へ)。
- FiLM 学習安定化のため HM3D-based InstanceImageNav で段階的 FiLM 訓練を用いて学習を安定化させる(FiLM 初期化を近似同一化に設定)
実験結果
リサーチクエスチョン
- RQ1グローバルなトポロジーガイダンスを、ローカル制御に適したコンパクトな信号へ効果的にエンコードする方法は?
- RQ2Explicitな 2-hop インテントは、部分観測下でグローバル計画とローカル反応決定の整合性を改善するか?
- RQ3BEV ベースの実現可能性精錬は、学習制御を補完して安全性と実行品質を向上させるか?
- RQ4初期方位の不確かさやインテント推定の不完全さに対して、インテント駆動制御はどれだけ頑健か?
主な発見
| Method | Imitate SR | Imitate SPL | Imitate SSPL | Alt Goal SR | Alt Goal SPL | Alt Goal SSPL | Shortcut SR | Shortcut SPL | Shortcut SSPL | Reverse SR | Reverse SPL | Reverse SSPL |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| RoboHop | 54.63 | 53.13 | 67.72 | 21.30 | 20.63 | 35.32 | 27.62 | 25.98 | 45.12 | 38.89 | 34.89 | 49.82 |
| TANGO | 64.81 | 59.21 | 72.67 | 24.07 | 20.57 | 36.85 | 34.29 | 30.56 | 48.90 | 55.56 | 48.48 | 62.28 |
| ObjectReact-ft | 63.89 | 57.84 | 76.05 | 26.85 | 23.79 | 38.50 | 39.05 | 34.55 | 57.28 | 51.85 | 48.04 | 64.94 |
| IntentReact | 81.48 | 76.12 | 87.85 | 34.26 | 31.07 | 43.69 | 60.95 | 53.86 | 74.35 | 62.04 | 59.89 | 70.18 |
- インテント条件付けは、複数タスク(模倣、代替ゴール、ショートカット、リバース)でベースラインより高いナビゲーション成功率と効率をもたらす。
- 2-hop インテントは反応性コントローラを過度に制約せず、グローバルガイダンスを意味ある形で提供し、SSPLとSPLを改善する。
- FiLM ベースのインテント条件付けは、ベースの ObjectReact-ft ポリシーより SPL および SSPL を大幅に向上させる。
- BEV ベースの実現可能性精錬は、ウェイポイントを通行可能領域へ射影することで実行をさらに安定化させる。
- 初期方位の摂動下で、IntentReact は頑健性が高く、あいまいさが増すほど大きな改善を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。