Skip to main content
QUICK REVIEW

[論文レビュー] Unrolled Generative Adversarial Networks

Luke Metz, Ben Poole|arXiv (Cornell University)|Nov 7, 2016
Anomaly Detection Techniques and Applications被引用数 425
ひとこと要約

この論文は、生成器の目的を識別器のアンロール最適化に基づいて定義することでGAN訓練を安定化させ、モード崩れを減らし多様性を向上させる。

ABSTRACT

We introduce a method to stabilize Generative Adversarial Networks (GANs) by defining the generator objective with respect to an unrolled optimization of the discriminator. This allows training to be adjusted between using the optimal discriminator in the generator's objective, which is ideal but infeasible in practice, and using the current value of the discriminator, which is often unstable and leads to poor solutions. We show how this technique solves the common problem of mode collapse, stabilizes training of GANs with complex recurrent generators, and increases diversity and coverage of the data distribution by the generator.

研究の動機と目的

  • GAN訓練における不安定性とモード崩壊を動機づけて対処する。
  • 識別器の最適化をアンロールして代理の生成器目的を導入する。
  • アンロールが標準的なGAN訓練と真の生成器損失の間をどのように挿入するかを探る。
  • 単純なデータセットから複雑なデータセットまで、一貫した多様性とカバレッジの改善を実証する。

提案手法

  • 生成器 G と識別器 D を用いたミニマックス問題としてGANの目的を定義する。
  • 識別器最適化をK回アンロールして代理目的関数 f_K を導入する: f_K(θ_G, θ_D) = f(θ_G, θ_D^K(θ_G, θ_D)).
  • アンロールされた最適化を通して生成器勾配を後方伝搬し θ_G を更新する。
  • 生成器勾配がアンロールされたステップを通じて伝搬する間、識別器を通常通り更新する。
  • G の変化に対する D の反応を捉える不足している勾配項と、それがモード崩壊をどのように緩和するかを説明する。
  • 注: より多くのアンロールステップは真の生成器損失に近い目的をもたらすが、計算コストが高くなる。

実験結果

リサーチクエスチョン

  • RQ1識別器最適化のアンロールは標準訓練と比較してGAN訓練を安定化させるか。
  • RQ2アンロールされたGANはデータセット全体でモードカバレッジを改善し、モード崩壊を低減するか。
  • RQ3アンロールステップ数は訓練ダイナミクスとサンプル多様性にどう影響するか。
  • RQ4アンロールはより複雑な生成器(例: RNNベースの生成器)で安定しない場合の訓練を可能にするか。

主な発見

  • アンロールドGANは2Dガウス混合分布で訓練を安定化させ、生成器が質量を広げてターゲット分布に収束することを可能にした。
  • MNIST上でアンロールGANを用いて訓練されたRNNベースの生成器は安定し、崩壊するのではなく分布をカバーする。
  • アンロールは離散モードのカバレッジを改善し、多数モードを持つデータセットをモデリングする際のKL発散を低減する。
  • CIFAR-10では、アンロールステップを増やすとサンプル多様性が高まり、再構成およびペアワイズ距離統計がデータ分布により近いものになる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。