Skip to main content
QUICK REVIEW

[論文レビュー] Do GANs actually learn the distribution? An empirical study

Sanjeev Arora, Yi Zhang|arXiv (Cornell University)|Jun 26, 2017
Generative Adversarial Networks and Image Synthesis参考文献 12被引用数 130
ひとこと要約

この論文は誕生日パラドックスに基づくテストを導入し、GAN生成分布のサポートサイズを推定し、いくつかのよく知られたGANが小さなサポートの分布を生み出すことを示しており、ターゲット分布を学習していない可能性があることを示唆している。 また、識別器容量が多様性に与える影響を検討し、GANのバリアントを比較している。

ABSTRACT

Do GANS (Generative Adversarial Nets) actually learn the target distribution? The foundational paper of (Goodfellow et al 2014) suggested they do, if they were given sufficiently large deep nets, sample size, and computation time. A recent theoretical analysis in Arora et al (to appear at ICML 2017) raised doubts whether the same holds when discriminator has finite size. It showed that the training objective can approach its optimum value even if the generated distribution has very low support ---in other words, the training objective is unable to prevent mode collapse. The current note reports experiments suggesting that such problems are not merely theoretical. It presents empirical evidence that well-known GANs approaches do learn distributions of fairly low support, and thus presumably are not learning the target distribution. The main technical contribution is a new proposed test, based upon the famous birthday paradox, for estimating the support size of the generated distribution.

研究の動機と目的

  • 実用的な制約の下でGANがターゲット分布を学習するかどうかという問題を動機づける。
  • 誕生日パラドックスに基づく分布サポートの定量的テストを提案する。
  • CelebAとCIFAR-10でいくつかのGANアーキテクチャを経験的に評価し、多様性とモード崩壊を評価する。
  • 識別器サイズが学習分布の多様性に与える影響を探る。

提案手法

  • サポートサイズを推定する誕生日パラドックスベースのテストを定義する。
  • サンプルのバッチを生成し、近似的に重複するペアを衝突の候補として識別する。
  • 候補の重複を視覚的に検査して、重複の有無を推測し、サポートサイズを推定する。
  • CelebAとCIFAR-10に対して、異なるGANバリアント(DCGAN, MIX+DCGAN, ALI/BiGAN, Stacked GAN)を適用してテストを実施する。
  • 実験で識別器容量が観測される多様性に与える影響を検討する。
  • VAEとLSUN-bedroomデータへの適用可能性について議論する。

実験結果

リサーチクエスチョン

  • RQ1GANは実用的なサンプルサイズの下でターゲット分布を近似する大きなサポートを持つ分布を生み出すのか。
  • RQ2識別器のサイズは学習された分布の多様性(サポートサイズ)にどのように影響するのか。
  • RQ3ALI/BiGANなどの双方向GANバリアントは標準的なGANよりも大きな多様性を達成するのか。
  • RQ4誕生日パラドックスベースのテストは、実データセットで訓練されたGANのモード崩壊や制限された多様性を暴露できるのか。
  • RQ5連続的で高次元の画像データに適用した場合の誕生日パラドックステストの限界は何か。

主な発見

  • CelebA上で一般的に使用されるアーキテクチャのGANは、約400サンプルのバッチで重複が発生する確率が≥50%となり、サポートサイズが約160,000程度以下であることを示唆する。
  • ALI/BiGANはより多様性を示し、約1000のバッチサイズで衝突が現れ、DCGAN/MIX+DCGANと比較して大きいが依然として制約されたサポート(約100万程度)を示唆する。
  • 識別器容量を増やすと観測される多様性が増大する傾向があり、検出されるサポートサイズはほぼ線形に成長し、いくらかの停滞に達する。
  • Stacked GANを用いたCIFAR-10では、クラスごとに異なるバッチサイズで重複が現れ、データセット全体のカバーではなくクラスごとの多様性に制限があることを示す。
  • LSUN-bedroomデータでは、観測される近似的重複はしばしば破損やノイズパターンに対応しており、テストがアーティファクトによって混乱する可能性があるとともに、分布がノイズに対して非自明な質量を置くことを示唆する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。