Skip to main content
QUICK REVIEW

[論文レビュー] Boundary-Seeking Generative Adversarial Networks

R Devon Hjelm, Athul Paul Jacob|arXiv (Cornell University)|Feb 27, 2017
Generative Adversarial Networks and Image Synthesis参考文献 36被引用数 112
ひとこと要約

BGAN は、識別器からの重要度重み付け付き方策勾配を導入して離散データ上でGANを訓練し、連続データにも目的を拡張して安定性を改善します。

ABSTRACT

Generative adversarial networks (GANs) are a learning framework that rely on training a discriminator to estimate a measure of difference between a target and generated distributions. GANs, as normally formulated, rely on the generated samples being completely differentiable w.r.t. the generative parameters, and thus do not work for discrete data. We introduce a method for training GANs with discrete data that uses the estimated difference measure from the discriminator to compute importance weights for generated samples, thus providing a policy gradient for training the generator. The importance weights have a strong connection to the decision boundary of the discriminator, and we call our method boundary-seeking GANs (BGANs). We demonstrate the effectiveness of the proposed algorithm with discrete image and character-based natural language generation. In addition, the boundary-seeking objective extends to continuous data, which can be used to improve stability of training, and we demonstrate this on Celeba, Large-scale Scene Understanding (LSUN) bedrooms, and Imagenet without conditioning.

研究の動機と目的

  • 識別器の f-ダイバーンス推定を活用してジェネレータの更新のための重要度重みを形成することにより、離散データを用いた GAN の訓練に対して原理的な方法を提供する。
  • 離散データおよび連続データの双方に対して安定なジェネレータ勾配を生み出す、低分散の境界志向目的を開発する。
  • 離散画像および文字レベルの言語タスクで有効性を示し、高次元の連続ベンチマークで安定性の向上を示す。

提案手法

  • GAN 目的を表現するために f-ダイバーンスの双対形を採用し、ニューラル識別器 T_phi を用いた変分下界を導く。
  • 識別器を用いて最適な重要度重み w(x) = (d f* / dT)(T(x)) を計算し、密度推定量 tilde{p}(x) = w(x) q_theta(x) / beta を定義する。
  • 離散データに対して、重要度重み付き推定量を用いた方策勾配風の更新を実装し、分散を低減する z 条件付きの低分散形 (tilde{p}(x|z)) を含む。
  • 安定性を高めるための連続データ向け BGAN 目的を提案する: 最小化 (log w(G_theta(z)))^2、同値に F_phi(G_theta(z))^2、最適化に対して振る舞いが良い。
  • 正規化された重みの計算とジェネレータおよび識別器の勾配更新を含む離散 BG AN 訓練アルゴリズム (Algorithm 1) を提供する。
  • フレームワークを REINFORCE ベースのバリアントへ拡張し、分散低減のためのベースライン手法(beta のような定数を介して)に接続する。

実験結果

リサーチクエスチョン

  • RQ1f-ダイバーンス識別器から導かれる境界志向の目的は、離散データを用いたGANの効果的な訓練を可能にするか?
  • RQ2境界志向および重要度重み付き目的は、標準的な GAN および WGAN-GP と比較して、離散および連続の設定で安定性と性能を改善するか?
  • RQ3境界志向アプローチは連続データへ拡張可能で、高次元の画像ベンチマークで安定性の利点をもたらすか?
  • RQ4異なる f-ダイバーンス(GAN、Jensen-Shannon、KL、Reverse KL、Squared-Hellinger)は、離散タスクで_BGAN_と組み合わせた場合どのように機能するか?
  • RQ5連続 BG AN 訓練の安定性に対する勾配ノルム正規化の影響は何か?

主な発見

MeasureISREINFORCE
Baseline26.6-
WGAN (clipping)72.3-
GAN26.227.1
Jensen-Shannon26.027.7
KL28.128.0
Reverse KL27.828.2
Squared-Hellinger27.028.0
  • BGAN は、識別器由来の重要度重みを用いてジェネレータのポリシー勾配を形成することで、離散データ上の訓練を可能にする。
  • 離散 CIFAR-10 分類実験では、重要度サンプリングを用いた BG AN が競争力のある誤差率(約 26%)を達成し、難しい設定で WGAN を大きく上回る。
  • 離散 MNIST および量子化された CelebA の実験は安定した訓練と現実的で多様なサンプルを示し、設定上 WGAN-GP よりも良い性能。
  • 1 billion word のデータでの文字レベル言語生成は、離散 BG AN が連続的緩和なしで意味のあるパターンを学べることを示し、安定性と実現可能性を示す。
  • CelebA、LSUN、ImageNet での勾配ノルム正規化を伴う連続 BG AN 実験は高品質なサンプルを生み出し、BGAN は高次元設定での安定性を維持する。
  • 連続 BG AN 目的 (log w(G_theta(z)))^2 は、変分下界のみに依存する場合よりも最適化の安定性を向上させ、特に勾配ノルム正規化を使用する場合に顕著である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。