[論文レビュー] FlowConsist: Make Your Flow Consistent with Real Trajectory
FlowConsist は、モデル予測の限界速度と軌道 rectification 戦略を用いて高速フローモデルの軌道整合性を訓練で強制し、1 サンプリングステップで ImageNet 256×256 の最先端結果を達成します。
Fast flow models accelerate the iterative sampling process by learning to directly predict ODE path integrals, enabling one-step or few-step generation. However, we argue that current fast-flow training paradigms suffer from two fundamental issues. First, conditional velocities constructed from randomly paired noise-data samples introduce systematic trajectory drift, preventing models from following a consistent ODE path. Second, the model's approximation errors accumulate over time steps, leading to severe deviations across long time intervals. To address these issues, we propose FlowConsist, a training framework designed to enforce trajectory consistency in fast flows. We propose a principled alternative that replaces conditional velocities with the marginal velocities predicted by the model itself, aligning optimization with the true trajectory. To further address error accumulation over time steps, we introduce a trajectory rectification strategy that aligns the marginal distributions of generated and real samples at every time step along the trajectory. Our method establishes a new state-of-the-art on ImageNet 256$\times$256, achieving an FID of 1.52 with only 1 sampling step.
研究の動機と目的
- 既存の高速フロー訓練が軌道のずれと誤差蓄積を引き起こす原因を特定する。
- marginals velocities を用いて最適化を真の軌道と整合させる訓練パラダイムを提案する。
- 各時刻ステップで生成分布と実分布を一致させる軌道 rectification 戦略を導入する。
- 最小サンプリングステップで ImageNet 256×256 における最先端性能を示す。
提案手法
- 条件付き速度(ノイズ–データ対)をモデル自身が予測する限界速度に置換する。
- 軌道に沿って生成サンプルと実サンプルの限界分布を各時刻ステップで合わせる軌道 rectification 戦略を開発する。
- このアプローチは高速フロー模型の訓練中の軌道整合性を強制することを目的とする。
- ImageNet 256×256 で、少数ステップサンプリングによる生成忠実度の改善を評価する。
実験結果
リサーチクエスチョン
- RQ1条件付き速度の定式化は高速フロー模型における軌道のずれを引き起こすのか。
- RQ2モデル自身が予測する限界速度は最適化を真の軌道とより良く整合させ得るのか。
- RQ3軌道 rectification は時系列ステップ間の誤差蓄積を減少させるのか。
- RQ4最小サンプリングステップによる高解像度画像合成の性能影響はどうか。
- RQ5FlowConsist は 1-step sampling で ImageNet 256×256 の最先端結果を達成するのか。
主な発見
- FlowConsist はモデル予測の限界速度を用いることで軌道のずれを緩和する。
- 軌道 rectification は各時刻ステップで生成分布と実分布の限界分布を整え、誤差蓄積を低減する。
- 本手法は ImageNet 256×256 においてわずか 1 サンプリングステップで最先端の FID を達成する(FID 1.52)。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。