QUICK REVIEW

[論文レビュー] Gradient descent GAN optimization is locally stable

Vaishnavh Nagarajan, J. Zico Kolter|arXiv (Cornell University)|Jun 13, 2017

Model Reduction and Neural Networks被引用数 76

ひとこと要約

この論文はGANのジェネレータとディスクリミネータの同時勾配アップデートを分析し、特定の条件下で局所的な指数安定性を示し、伝統的なGANとWGANの両方の安定性を保証する勾配ベースの正則化を提案します。

ABSTRACT

Despite the growing prominence of generative adversarial networks (GANs), optimization in GANs is still a poorly understood topic. In this paper, we analyze the "gradient descent" form of GAN optimization i.e., the natural setting where we simultaneously take small gradient steps in both generator and discriminator parameters. We show that even though GAN optimization does not correspond to a convex-concave game (even for simple parameterizations), under proper conditions, equilibrium points of this optimization procedure are still \emph{locally asymptotically stable} for the traditional GAN formulation. On the other hand, we show that the recently proposed Wasserstein GAN can have non-convergent limit cycles near equilibrium. Motivated by this stability analysis, we propose an additional regularization term for gradient descent GAN updates, which \emph{is} able to guarantee local stability for both the WGAN and the traditional GAN, and also shows practical promise in speeding up convergence and addressing mode collapse.

研究の動機と目的

GとDが同時に更新される勾配降下型 GAN の最適化の安定性を動機づけ、分析する。
適切な条件の下で平衡点が局所的に指数安定であることを示す。
WGANは勾配降下において収束しない極限巡回を示すことができる。
GANとWGANの設定の双方で局所安定性を保証する判別器勾配への正則化項を提案する。
提案された正則化をunrolled GANsや実践的な訓練改善と関連付ける。

提案手法

凹関数 f を用いた一般化 GAN 目的関数を定式化し、勾配降下更新を動的システムとして分析する。
ODE 法と線形化を適用して平衡点周りの局所安定性を研究する。
平衡点でのヤコビ行列を表す行列 K_DD と K_DG を定義・利用する。
仮定(I–IV)の下で局所的な指数安定性を証明し、複数の平衡点を持つ場合について議論する。
この勾配降下設定ではWasserstein GANsが非収束極限巡回を持つ可能性があることを示す（全局収束は保証されない）。
平衡を保持し局所安定性を課すジェネレーター更新用の勾配ペナルティ正則化を導入する（ダブルバックプロップ）。

実験結果

リサーチクエスチョン

RQ1どのような条件下で勾配降下型 GAN の更新は平衡点の周りで局所的に指数安定になるのか？
RQ2伝統的なGANとWGANの双方は勾配降下ダイナミクス下で局所安定性を持つのか？
RQ3正則化項はGANとWGANの双方の定式化に対して局所安定性を保証できるのか？
RQ4勾配降下更新における極限巡回の存在はGANとWGANでどのように異なるのか？
RQ5提案された勾配ペナルティと unrolled GANs のような既存の安定化手法との関係は何か？

主な発見

適切な曲率条件の下で、GANの勾配降下ダイナミクスは良好な平衡点の周りで局所的に指数安定になり得る。
WGANは平衡点付近で勾配降下更新に非収束的な極限巡回を示すことがある。
判別器勾配に対する勾配ベースの正則化項は、GANとWGANの双方について局所的な指数安定性を保証する。
正則化項は実装が簡単で、収束を速め、モード崩壊の防止に役立つ。
解析は unrolled GANs や改善された WGAN 訓練手法と関連づけつつ、差異を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。