QUICK REVIEW

[論文レビュー] Multi-objective training of Generative Adversarial Networks with multiple discriminators

Isabela Albuquerque, João Monteiro|arXiv (Cornell University)|Jan 24, 2019

Anomaly Detection Techniques and Applications被引用数 26

ひとこと要約

本稿では、複数の判別器を用いた生成対抗ネットワーク（GAN）のトレーニングのためのマルチオブジェクティブ最適化フレームワークを提案する。各判別器の損失を独立した目的関数として扱い、ハイパーボリューム最大化を用いて各判別器からの勾配の重みを動的に調整することで、平均損失最小化や複数勾配降下法よりも優れたサンプル品質と多様性を達成する。また、後者よりも計算効率が良く、高い性能を維持する。

ABSTRACT

Recent literature has demonstrated promising results for training Generative Adversarial Networks by employing a set of discriminators, in contrast to the traditional game involving one generator against a single adversary. Such methods perform single-objective optimization on some simple consolidation of the losses, e.g. an arithmetic average. In this work, we revisit the multiple-discriminator setting by framing the simultaneous minimization of losses provided by different models as a multi-objective optimization problem. Specifically, we evaluate the performance of multiple gradient descent and the hypervolume maximization algorithm on a number of different datasets. Moreover, we argue that the previously proposed methods and hypervolume maximization can all be seen as variations of multiple gradient descent in which the update direction can be computed efficiently. Our results indicate that hypervolume maximization presents a better compromise between sample quality and computational cost than previous methods.

研究の動機と目的

複数のディスクリミネータを用いたトレーニングをマルチオブジェクティブ最適化問題として再定式化することで、GANのトレーニング不安定性とモード崩壊を解消すること。
複数のディスクリミネータと適応的勾配重み付けを活用して、GANのサンプル品質と多様性を向上させること。
マルチオブジェクティブGANトレーニングにおける複数勾配降下法（MGD）の計算効率の良い代替手法を開発すること。
ディスクリミネータ数の増加がジェネレータのロバストネス、サンプル品質、多様性に与える影響を評価すること。
ハイパーボリューム最大化が、既存の手法と比較して計算コストとサンプル品質の間でより優れたトレードオフを実現できることを示すこと。

提案手法

ジェネレータはハイパーボリューム最大化（HV）を用いてトレーニングされ、複数のディスクリミネータの損失の重み付き組み合わせを最適化する。重みは各ディスクリミネータのパフォーマンスに応じて動的に調整される。
目的空間におけるハイパーボリュームを定義するために、損失の上界として共通のナディルポイント $\bm{\eta}^{*}$ を用いる。
勾配更新は、各ディスクリミネータのハイパーボリューム改善への寄与度に応じた重み付けにより、全ディスクリミネータからの勾配を集約して計算される。
実験では、MNISTおよびCIFAR-10を用い、DCGAN、LSGAN、HingeGANアーキテクチャで、平均損失最小化、MGD、GMANと比較される。
ミニバッチサイズ64、150エポックでトレーニングが実施され、ディスクリミネータの更新が並列化可能であるため、1枚のGPU上でも効率的な計算が可能である。
本手法は、ハイパーボリュームに基づく重み付けにより、更新方向を効率的に計算する複数勾配降下法の一種であることが示された。

実験結果

リサーチクエスチョン

RQ1複数のディスクリミネータを用いた場合、マルチオブジェクティブ最適化はGANのトレーニング安定性とサンプル多様性を向上させ得るか？
RQ2平均損失最小化や複数勾配降下法と比較して、ハイパーボリューム最大化はサンプル品質と計算コストの面でどのように異なるか？
RQ3ディスクリミネータ数の増加はジェネレータのロバストネスとモードカバレッジを向上させるか？
RQ4スタックドMNISTおよびCIFAR-10におけるディスクリミネータ数の増加がFIDスコアとモードカバレッジに与える影響は何か？
RQ5ハイパーボリューム最大化は、MGDよりも低い計算オーバーヘッドで最先端の性能を達成できるか？

主な発見

MNISTでは、24個のディスクリミネータを用いたハイパーボリューム最大化により、FID-ResNetが1.89に達し、平均損失最小化やGMANを上回り、MGDよりも計算効率が良かった。
CIFAR-10では、ベースラインGANよりも高い品質のサンプルが生成され、ディスクリミネータ数の増加に伴いFIDスコアが一貫して改善された。
スタックドMNISTでは24個のディスクリミネータを用いた際、1000.0 ± 0.0のモードをカバーし、逆KLDが0.084 ± 0.002に達し、DCGAN、ALI、アンラップドGAN、VEEGANを上回った。
ディスクリミネータ数を8から24に増加させたことで、モードカバレッジは679.2 ± 5.9から1000.0 ± 0.0に向上し、多様性とロバストネスの向上が明確に示された。
8または16個のディスクリミネータを用いた場合、WGAN-GPよりも1イテレーションあたりのウォルクロック時間が短く、1GPU環境下での実用性が顕著に優れていた。
ハイパーボリューム最大化は、MGDや平均損失最小化と比較して、ハイパーパramータへの感受性が低く、計算コストとサンプル品質のトレードオフが優れていた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。