Skip to main content
QUICK REVIEW

[論文レビュー] f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization

Sebastian Nowozin, Botond Cseke|arXiv (Cornell University)|Jun 2, 2016
Adversarial Robustness in Machine Learning参考文献 29被引用数 636
ひとこと要約

論文はGAN訓練がf-ダイバージェンス上の変分的ダイバージェンス最小化の特別なケースであることを示し、変分識別器を用いて任意のfダイバージェンスで訓練できるように生成ニューラルサンプラーを一般化する。

ABSTRACT

Generative neural samplers are probabilistic models that implement sampling using feedforward neural networks: they take a random input vector and produce a sample from a probability distribution defined by the network weights. These models are expressive and allow efficient computation of samples and derivatives, but cannot be used for computing likelihoods or for marginalization. The generative-adversarial training method allows to train such models through the use of an auxiliary discriminative neural network. We show that the generative-adversarial approach is a special case of an existing more general variational divergence estimation approach. We show that any f-divergence can be used for training generative neural samplers. We discuss the benefits of various choices of divergence functions on training complexity and the quality of the obtained generative models.

研究の動機と目的

  • Jensen-Shannon/GAN を超えるダイバージェンスを用いた生成ニューロン・サンプラーの訓練を動機づけ、 formalize する。
  • 変分ダイバージェンス最小化(VDM)を、Q_theta を P に近づける学習の一般的な枠組みとして導入する。
  • 幅広いfダイバージェンス族に対してf-GAN目的を導出し、ニューラルネットでの実装方法を示す。
  • 異なるfダイバージェンスに対処する実用的な最適化手法と活性化設計を明確化する。
  • データ画像とモデル性能に対するダイバージェンス選択の経験的影響を実証する。

提案手法

  • 凸共役 f* によるf-ダイバージェンスとそれらの変分表現をレビューする。
  • f-GAN鞍点目的 F(theta, omega) = E_{x~P}[T_omega(x)] - E_{x~Q_theta}[f*(T_omega(x))] を定式化する。
  • 変分関数を T_omega(x) = g_f(V_omega(x)) と適切な出力活性化を用いて dom(f*) に合わせて表現する。
  • GAN/JS が一般的な F(θ, ω) 目的の特定の活性化と T* を用いた特別なケースであることを示す。
  • 鞍点を1回のパスで更新する実用的な単一ステップ勾配法を提案し、生成器と変分関数を同時に更新する。
  • 代替的な生成器更新、実データ/偽データ統計、最適化支援(Adam、勾配クリッピング)などの訓練のヒントを議論する。

実験結果

リサーチクエスチョン

  • RQ1任意のf-ダイバージェンスを変分目的を介して生成サンプラーの訓練に用いることは可能か。
  • RQ2fダイバージェンスの選択は訓練ダイナミクスと学習分布の質にどのように影響するか。
  • RQ3分散を跨いで変分関数を実装する際の実用的考慮事項は何か。
  • RQ4単一ステップの最適化アプローチは妥当な条件下で鞍点へ収束するのか。
  • RQ5MNISTやLSUNなど実データセットに対してダイバージェンスは結果にどう影響するか。

主な発見

  • 任意のf-ダイバージェンスは、変分識別器と組み合わせると生成サンプラーの訓練目的として有効である。
  • GAN 訓練はより広い f-GAN/VDM フレームワークの特別なケースとして再現可能である。
  • 実用的な単一ステップ勾配法は、滑らかさと凸性の緩い仮定のもとで鞍点へ収束し得る。
  • モデルがミスフィットした場合、異なるダイバージェンスは異なる学習分布をもたらし、モデル適合へのダイバージェンスの影響を浮き彫りにする。
  • MNISTとLSUNの経験的研究では、ダイバージェンスによりサンプル品質と尤度挙動が異なることが示され、KL関連ダイバージェンスは時にMNIST実験でホールドアウト尤度を高める。
  • このフレームワークは各f-ダイバージェンスに対応する出力活性化と T* の指針を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。