QUICK REVIEW

[論文レビュー] Mode Regularized Generative Adversarial Networks

Tong Che, Yanran Li|arXiv (Cornell University)|Dec 7, 2016

Generative Adversarial Networks and Image Synthesis参考文献 25被引用数 229

ひとこと要約

本論文は、オートエンコーダーベースの正則化手法と二段階のMDGANトレーニング手順を導入し、GANを安定化させ、欠損モードを緩和して、多様性とサンプル品質を向上させる。

ABSTRACT

Although Generative Adversarial Networks achieve state-of-the-art results on a variety of generative tasks, they are regarded as highly unstable and prone to miss modes. We argue that these bad behaviors of GANs are due to the very particular functional shape of the trained discriminators in high dimensional spaces, which can easily make training stuck or push probability mass in the wrong direction, towards that of higher concentration than that of the data generating distribution. We introduce several ways of regularizing the objective, which can dramatically stabilize the training of GAN models. We also show that our regularizers can help the fair distribution of probability mass across the modes of the data generating distribution, during the early phases of training and thus providing a unified solution to the missing modes problem.

研究の動機と目的

高次元空間における識別器の形状に起因するGAN訓練の不安定性とモード欠如問題を動機づける。
GAN目的関数に安定な幾何学的信号と分布的信号を付加する正則化を提案する。
データと生成マニホールドの整合性を促進し、モード間での質量分布の公平性を促進する。
安定性とサンプル品質を向上させる2段階のトレーニング手順（マニホールドステップとディフュージョンステップ）を開発する。

提案手法

エンコーダを介して生成サンプルと再構成の距離を最小化する幾何学的メトリック正則化を導入し、d(x, G(E(x)))を用いる。
近傍データモードの探索を促進するためにlog D(G(E(x)))を用いるモード正則化を組み込む。
マニホールドステップでマニホールドを整列させ、ディフュージョンステップでモード間に質量を分配する2段階のManifold-Diffusionトレーニング（MDGAN）を提案する。
再構成およびモードマッチング項を組み合わせた敵対項を含む正則化された生成器目的関数 T_G を定義する。
再構成および敵対的整合性項を含む正則化されたエンコーダー目的関数 T_E を定義する。
モードカバレッジの評価指標を議論する。 inception/MODE スコアや第三者ディスcriminatorベースの欠損モード推定量を含む。

実験結果

リサーチクエスチョン

RQ1正則化がGAN訓練の安定性と勾配挙動にどう影響するか？
RQ2幾何ベースおよび再構成ベースの信号は、欠損モードを減らし、モード表現の公平性を促進できるか？
RQ32段階のマニホールド-ディフュージョン訓練スキームは、サンプル品質とモード多様性の両方を改善するか？
RQ4正則化されたGANにおいて、モードカバレッジとサンプル品質を最も適切に捉える指標は何か？
RQ5提案された正則化手法は、多モーダルなデータ分布を持つタスクで標準のGANとどのように比較されるか？

主な発見

正則化手法はGAN訓練を劇的に安定化させ、モデルの分散を低減する。
正則化手法はデータモード間で確率質量をより公正に分配するのを助け、欠損モードに対処する。
MDGANはCelebAにおけるベースラインGAN系よりもサンプルの一貫性とシャープさを向上させる。
定量的指標はMODEスコアの改善と組成的MNIST実験における欠損モードの減少を示す。
提案手法による定性的サンプルは、視覚的忠実度が高く、多様なモードを示す。
いくつかのベースラインと比較して、MDGAN/Regularized-GANアプローチは多様性と品質のバランスがより良い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。