[論文レビュー] Solving Inverse Problems with Flow-based Models via Model Predictive Control
MPC-Flow は、事前学習済みフローモデルを用いた条件付き生成を短期地平の最適制御問題の連続として再定義し、推論時にトレーニング不要なガイダンスを提供する。メモリ効率と大規模モデルへのスケーラビリティを実現。
Flow-based generative models provide strong unconditional priors for inverse problems, but guiding their dynamics for conditional generation remains challenging. Recent work casts training-free conditional generation in flow models as an optimal control problem; however, solving the resulting trajectory optimisation is computationally and memory intensive, requiring differentiation through the flow dynamics or adjoint solves. We propose MPC-Flow, a model predictive control framework that formulates inverse problem solving with flow-based generative models as a sequence of control sub-problems, enabling practical optimal control-based guidance at inference time. We provide theoretical guarantees linking MPC-Flow to the underlying optimal control objective and show how different algorithmic choices yield a spectrum of guidance algorithms, including regimes that avoid backpropagation through the generative model trajectory. We evaluate MPC-Flow on benchmark image restoration tasks, spanning linear and non-linear settings such as in-painting, deblurring, and super-resolution, and demonstrate strong performance and scalability to massive state-of-the-art architectures via training-free guidance of FLUX.2 (32B) in a quantised setting on consumer hardware.
研究の動機と目的
- Flow ベースのモデルを逆問題の事前知識として動機づけ、再訓練なしでの条件付けを扱う。
- 実用的な推論時ガイダンスフレームワーク(MPC-Flow)を提案し、データ整合解へとフローを誘導する。
- MPC-Flow と基礎となる最適制御目的の理論的保証を分析する。
- 再帰的地平と短地平のバリアントが最適性、メモリ使用、スケーラビリティのトレードオフを提供することを示す。
- 線形/非線形の画像復元タスクでの性能を示し、FLUX.2(32B)などの大規模モデルへのスケールを実証する。
提案手法
- データ適合端末コスト Phi を持つ決定論的最適制御問題として、フローモデルを用いた逆問題解決を定式化する。
- MPC-Flow を導入:各時刻で有限地平のサブ問題を解き、最適制御の最初の部分だけを適用する(リセディング・ホライズン)。
- 二つの地平 regime を提示:リセディング・ホライズン制御(RHC, H = 1 − t)と Delta-t ホライズン制御(H = Δt)。
- MPC-Flow をグローバルな最適制御目的へ結ぶ理論的結果を提示(特定条件下での最適性)。
- Phi_MPC を値関数と等しくする Delta-t ホライズンはグローバルに最適な方策を生み出す可能性があり、実用的な一ステップのオイラー近似が有用なヒューリスティックを提供する。
- 全体の軌跡をバックプロパゲーションせず計算資源を抑える特殊な K=1 の単一ステップ RHC 変種を示し、スケーラビリティを向上させる。

実験結果
リサーチクエスチョン
- RQ1訓練を再度行うことなく、事前学習済みのフローモデルを用いて逆問題のデータ整合解へガイドすることが MPC-Flow で可能か。
- RQ2RHC と Delta-t の異なる地平選択が、最適性、メモリ使用、そして大規模フローアーキテクチャでのスケーラビリティにどう影響するか。
- RQ3MPC-Flow のサブ問題と基盤となるグローバル最適制御目的との理論的保証は何か。
- RQ4線形および非線形の画像復元タスクで MPC-Flow がどの程度機能し、32B パラメータのフローモデルへスケールするか。
- RQ5推論時の性能に影響する実用的な考慮事項(初期化、離散化、バックプロパゲーションコスト)は何か。
主な発見
- MPC-Flow はフロー型逆問題に対して強力な推論時ガイダンスを提供し、いくつかの設定でグローバル最適制御のベースラインを上回る。
- 適切なサブ問題解法があればリセディング・ホライズン(H = 1 − t)は最適軌道を達成でき、K=1 の場合はメモリの利点がある。
- Phi_MPC を価値関数と等しくした Delta-t ホライズンはグローバルに最適となり得、現実的な一ステップのオイラー近似が実用的なヒューリスティックを提供。
- 単一ステップ(K=1) RHC 設定はメモリと計算を大幅に削減し、FLUX.2(32B)などの大規模モデルを家庭用ハードウェアでスケール可能にする。
- ノイズ除去、ぼかし除去、超解像、インペインティング、非線形のぼかし除去などのタスク全般において、MPC-Flow のバリアントは FlowGrad および OC-Flow より効率性で一貫して優れ、再構成品質も向上することが多い。
- 訓練不要で大規模な事前学習済みフローモデル(量子化版を含む)へのガイダンスを実現し、競争力のある結果を得る。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。