Skip to main content
QUICK REVIEW

[論文レビュー] GenPlanner: From Noise to Plans -- Emergent Reasoning in Flow Matching and Diffusion Models

Agnieszka Polowczyk, Alicja Polowczyk|arXiv (Cornell University)|Feb 21, 2026
Robotic Path Planning Algorithms被引用数 0
ひとこと要約

GenPlanner は conditioned multi-channel inputs から拡散と流れマッチングを用いて反復的に迷路経路を生成し、CNN ベースラインを上回る。FlowPlanner は生成ステップが少なくても頑健である。

ABSTRACT

Path planning in complex environments is one of the key problems of artificial intelligence because it requires simultaneous understanding of the geometry of space and the global structure of the problem. In this paper, we explore the potential of using generative models as planning and reasoning mechanisms. We propose GenPlanner, an approach based on diffusion models and flow matching, along with two variants: DiffPlanner and FlowPlanner. We demonstrate the application of generative models to find and generate correct paths in mazes. A multi-channel condition describing the structure of the environment, including an obstacle map and information about the starting and destination points, is used to condition trajectory generation. Unlike standard methods, our models generate trajectories iteratively, starting with random noise and gradually transforming it into a correct solution. Experiments conducted show that the proposed approach significantly outperforms the baseline CNN model. In particular, FlowPlanner demonstrates high performance even with a limited number of generation steps.

研究の動機と目的

  • 高次元ナビゲーションタスクにおける計画と推論の必要性を動機づける。
  • 経路生成のためのマルチチャネル条件付けスキーム(開始点、目標、壁)を導入する。
  • 2つの生成的計画バリエーションを提案する—DiffPlanner(拡散)と FlowPlanner(流れマッチング)。
  • 提案手法が CNN ベースラインよりも効率的に迷路計画を解き、軌道品質も高いことを実証する。

提案手法

  • 4チャネル入力(ノイズ付き経路と迷路条件付け)を用いた条件付き画像生成として経路計画を定式化する。
  • 反復的な軌道 refinement を予測する速度場を用いる FlowPlanner を実装する。
  • ノイズを予測して経路を回復するノイズ除去拡散モデル DiffPlanner を実装する。
  • 平均二乗誤差目的で訓練する:流れベースの速度適合と拡散ノイズ予測。
  • FlowPlanner はオイラー積分で推論し、DiffPlanner は DDIM サンプリングで推論して軌道を生成する。
  • 8×8 から 48×48 の迷路サイズで評価指標を用いて評価する。
Figure 2: Failure case of logical and spatial reasoning in a vision–language model. Given a maze image with start and goal locations, the VLM (Qwen) generates a plausible sequence of directional moves, yet the resulting path is invalid. This example highlights the difficulty of current VLMs in perfo
Figure 2: Failure case of logical and spatial reasoning in a vision–language model. Given a maze image with start and goal locations, the VLM (Qwen) generates a plausible sequence of directional moves, yet the resulting path is invalid. This example highlights the difficulty of current VLMs in perfo

実験結果

リサーチクエスチョン

  • RQ1拡散ベースと流れマッチング生成モデルは CNN ベースラインよりも効果的に迷路経路計画を解けるか。
  • RQ2FlowPlanner と DiffPlanner における生成ステップの反復が解の品質と安定性にどう影響するか。
  • RQ3条件付けチャネル(壁、開始点、終了点)の影響が生成経路の品質と正確性にどう寄与するか。
  • RQ4提案表現は迷路サイズや障害物密度の増加にどうスケールするか。

主な発見

Maze SizeModelValidity (%)Single-Path (%)Length RatioBranch-Rate (%)
8×8CNN92.8089.201.000.29
8×8FlowPlanner94.0092.401.000.26
8×8DiffPlanner90.4077.201.021.95
16×16CNN74.0065.201.000.82
16×16FlowPlanner88.6086.201.010.19
16×16DiffPlanner84.6067.601.032.15
32×32CNN49.6045.201.000.42
32×32FlowPlanner82.2081.601.010.05
32×32DiffPlanner88.6082.801.030.44
48×48CNN38.7028.401.000.95
48×48FlowPlanner88.0086.101.020.09
48×48DiffPlanner89.0076.101.040.47
  • FlowPlanner は迷路サイズを問わず総合的に最高の性能を達成し、高い有効性と単一路線性を維持しつつ分岐を最小化する。
  • FlowPlanner は生成ステップが少なくても高い経路品質を維持し、低ステップ領域での DiffPlanner より優れている。
  • 3つの条件付けチャネル(壁、開始点、終了点)は高品質な経路生成にとって重要であり、いずれかのチャネルを削除すると性能が低下する。
  • FlowPlanner は CNN ベースラインより一貫して有効性と経路規則性で上回り、最短経路長比に近い値を示す。
Figure 3: Overview of FlowPlanner training and inference. FlowPlanner treats path planning as a denoising process. A U-Net conditioned on walls and start-goal locations predicts velocity at each timestep, enabling iterative refinement from random noise to correct the route, where the pixel value > 0
Figure 3: Overview of FlowPlanner training and inference. FlowPlanner treats path planning as a denoising process. A U-Net conditioned on walls and start-goal locations predicts velocity at each timestep, enabling iterative refinement from random noise to correct the route, where the pixel value > 0

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。