[論文レビュー] Generalization and Equilibrium in Generative Adversarial Nets (GANs)
本論文は、 GANの一般化が標準の指標では失敗する可能性がある一方でニューラルネット距離では成り立つことを示し、ジェネレーターの混合による近似平衡の存在を証明し、実践的な安定化手法としてMIX+GANを提案する。
We show that training of generative adversarial network (GAN) may not have good generalization properties; e.g., training may appear successful but the trained distribution may be far from target distribution in standard metrics. However, generalization does occur for a weaker metric called neural net distance. It is also shown that an approximate pure equilibrium exists in the discriminator/generator game for a special class of generators with natural training objectives when generator capacity and training set sizes are moderate. This existence of equilibrium inspires MIX+GAN protocol, which can be combined with any existing GAN training, and empirically shown to improve some of them.
研究の動機と目的
- 標準的な分布距離の下でGANの訓練が一般化しない可能性があることを示す。
- GANのための扱いやすい一般化指標としてニューラルネット距離を導入する。
- GANゲームにおけるジェネレーターの混合を介して近似的な純均衡の存在を証明する。
- 実用的な訓練フレームワークとしてMIX+GANを提案し、経験的に検証する。
提案手法
- ニューラルネット判別器とジェネレーターを用い、共通の目的関数でGAN訓練を定義する。
- F距離とニューラルネット距離を統一的な発散尺度として導入する。
- 多項式のサンプル複雑性を持つニューラルネット距離の一般化保証を証明する。
- ジェネレーターの無限混合がGANゲームにおいてほぼ最適な平衡を達成できることを示す。
- 近似的な純平衡を実現する有限混合集成を提案し、ネットワークサイズの境界を導出する。
- 混合集成を既存のGAN目的と組み合わせ、エントロピー正則化を用いて多様性を促進する実践的な訓練プロトコルとしてMIX+GANを導入する。
実験結果
リサーチクエスチョン
- RQ1標準的な距離指標(JS, Wasserstein)で、多項式のサンプル数を用いた場合、GAN訓練は一般化するか?
- RQ2より弱い指標(ニューラルネット距離)がGANの一般化保証を提供できるか?
- RQ3GANゲームに平衡が存在し、実用的なネットワークサイズで実現できるか?
- RQ4ジェネレーターの混合は近似平衡を達成でき、これを単一のネットワーク(純粋平衡)として実装できるか?
- RQ5MIX+GANフレームワークは訓練を安定化させ、経験的に性能を向上させるか?
主な発見
| 手法 | スコア |
|---|---|
| SteinGAN ( Wang and Liu, 2016 ) | 6.35 |
| Improved GAN ( Salimans et al., 2016 ) | 8.09 ± 0.07 |
| AC-GAN ( Odena et al., 2016 ) | 8.25 ± 0.07 |
| S-GAN (best variant in Huang et al., 2017) | 8.59 ± 0.12 |
| DCGAN (as reported in Wang and Liu, 2016) | 6.58 |
| DCGAN (best variant in Huang et al., 2017) | 7.16 ± 0.10 |
| DCGAN (5x size) | 7.34 ± 0.07 |
| MIX+DCGAN (Ours, with 5 components) | 7.72 ± 0.09 |
| Wasserstein GAN | 3.82 ± 0.06 |
| MIX+WassersteinGAN (Ours, with 5 components) | 4.04 ± 0.07 |
- 標準的なJS発散とWasserstein距離は、多項式サンプル数では一般化しない。
- ニューラルネット距離は多項式サンプルで一般化を享受し、GAN訓練の代理保証を提供する。
- ジェネレーターの有限混合集成によって近似平衡が存在し、純平衡のような構成は控えめなネットワークサイズの増加で可能。
- MIX+GANフレームワークは訓練を安定化させ、CIFAR-10、MNIST、CelebAなどのデータセットで改善をもたらす。
- 経験的結果はMIX+DCGANがいくつかのベースラインより高いInception Scoreを達成することを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。