Skip to main content
QUICK REVIEW

[論文レビュー] Generalization and Equilibrium in Generative Adversarial Nets (GANs)

Sanjeev Arora, Rong Ge|arXiv (Cornell University)|Mar 2, 2017
Generative Adversarial Networks and Image Synthesis被引用数 211
ひとこと要約

本論文は、 GANの一般化が標準の指標では失敗する可能性がある一方でニューラルネット距離では成り立つことを示し、ジェネレーターの混合による近似平衡の存在を証明し、実践的な安定化手法としてMIX+GANを提案する。

ABSTRACT

We show that training of generative adversarial network (GAN) may not have good generalization properties; e.g., training may appear successful but the trained distribution may be far from target distribution in standard metrics. However, generalization does occur for a weaker metric called neural net distance. It is also shown that an approximate pure equilibrium exists in the discriminator/generator game for a special class of generators with natural training objectives when generator capacity and training set sizes are moderate. This existence of equilibrium inspires MIX+GAN protocol, which can be combined with any existing GAN training, and empirically shown to improve some of them.

研究の動機と目的

  • 標準的な分布距離の下でGANの訓練が一般化しない可能性があることを示す。
  • GANのための扱いやすい一般化指標としてニューラルネット距離を導入する。
  • GANゲームにおけるジェネレーターの混合を介して近似的な純均衡の存在を証明する。
  • 実用的な訓練フレームワークとしてMIX+GANを提案し、経験的に検証する。

提案手法

  • ニューラルネット判別器とジェネレーターを用い、共通の目的関数でGAN訓練を定義する。
  • F距離とニューラルネット距離を統一的な発散尺度として導入する。
  • 多項式のサンプル複雑性を持つニューラルネット距離の一般化保証を証明する。
  • ジェネレーターの無限混合がGANゲームにおいてほぼ最適な平衡を達成できることを示す。
  • 近似的な純平衡を実現する有限混合集成を提案し、ネットワークサイズの境界を導出する。
  • 混合集成を既存のGAN目的と組み合わせ、エントロピー正則化を用いて多様性を促進する実践的な訓練プロトコルとしてMIX+GANを導入する。

実験結果

リサーチクエスチョン

  • RQ1標準的な距離指標(JS, Wasserstein)で、多項式のサンプル数を用いた場合、GAN訓練は一般化するか?
  • RQ2より弱い指標(ニューラルネット距離)がGANの一般化保証を提供できるか?
  • RQ3GANゲームに平衡が存在し、実用的なネットワークサイズで実現できるか?
  • RQ4ジェネレーターの混合は近似平衡を達成でき、これを単一のネットワーク(純粋平衡)として実装できるか?
  • RQ5MIX+GANフレームワークは訓練を安定化させ、経験的に性能を向上させるか?

主な発見

手法スコア
SteinGAN ( Wang and Liu, 2016 )6.35
Improved GAN ( Salimans et al., 2016 )8.09 ± 0.07
AC-GAN ( Odena et al., 2016 )8.25 ± 0.07
S-GAN (best variant in Huang et al., 2017)8.59 ± 0.12
DCGAN (as reported in Wang and Liu, 2016)6.58
DCGAN (best variant in Huang et al., 2017)7.16 ± 0.10
DCGAN (5x size)7.34 ± 0.07
MIX+DCGAN (Ours, with 5 components)7.72 ± 0.09
Wasserstein GAN3.82 ± 0.06
MIX+WassersteinGAN (Ours, with 5 components)4.04 ± 0.07
  • 標準的なJS発散とWasserstein距離は、多項式サンプル数では一般化しない。
  • ニューラルネット距離は多項式サンプルで一般化を享受し、GAN訓練の代理保証を提供する。
  • ジェネレーターの有限混合集成によって近似平衡が存在し、純平衡のような構成は控えめなネットワークサイズの増加で可能。
  • MIX+GANフレームワークは訓練を安定化させ、CIFAR-10、MNIST、CelebAなどのデータセットで改善をもたらす。
  • 経験的結果はMIX+DCGANがいくつかのベースラインより高いInception Scoreを達成することを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。