QUICK REVIEW

[論文レビュー] Generative Adversarial Network Training is a Continual Learning Problem

Kevin J Liang, Chunyuan Li|arXiv (Cornell University)|Nov 27, 2018

Domain Adaptation and Few-Shot Learning参考文献 15被引用数 38

ひとこと要約

この論文は、生成器の分布が進化することで判別器が過去に生成されたサンプルの記憶を失うという危険な忘れやすさを引き起こすため、GANの学習を継続的学習問題として再定式化する。Elastic Weight Consolidation (EWC) および Intelligent Synapses (IS) を判別器に適用することで、過去の偽物サンプルの認識が維持され、FID（最大10.92）、ICP（最大7.58）、BLEUスコア（最大0.934）が向上し、計算コストの増加は最小限に抑えられる。

ABSTRACT

Generative Adversarial Networks (GANs) have proven to be a powerful framework for learning to draw samples from complex distributions. However, GANs are also notoriously difficult to train, with mode collapse and oscillations a common problem. We hypothesize that this is at least in part due to the evolution of the generator distribution and the catastrophic forgetting tendency of neural networks, which leads to the discriminator losing the ability to remember synthesized samples from previous instantiations of the generator. Recognizing this, our contributions are twofold. First, we show that GAN training makes for a more interesting and realistic benchmark for continual learning methods evaluation than some of the more canonical datasets. Second, we propose leveraging continual learning techniques to augment the discriminator, preserving its ability to recognize previous generator samples. We show that the resulting methods add only a light amount of computation, involve minimal changes to the model, and result in better overall performance on the examined image and text generation tasks.

研究の動機と目的

生成器の分布が変化することで生じる継続的学習問題としての判別器の危険な忘れやすさに起因する、GAN学習におけるモード崩壊や振動の根本的問題を解決すること。
従来のデータセットとは異なり、現実世界の危険な忘れのダイナミクスを反映しないことが多いため、GAN学習が継続的学習のより現実的なベンチマークを提供できるかどうかを評価すること。
判別器に継続的学習正則化を統合することで、GAN学習の安定性と性能を向上させ、過去に生成されたサンプルを認識する能力を維持すること。
EWC や IS といった既存の継続的学習手法が、アーキテクチャ的・訓練プロトコル的な大幅な変更なしに、GANに効果的に適用可能であることを示すこと。
本手法が、CelebA、CIFAR-10、MS COCO Captions といった複数のベンチマークで、画像生成およびテキスト生成の品質を向上させることを示すこと。

提案手法

EWC および IS を GAN の判別器に適応させ、過去の生成器分布における重要なパラメータをフィッシャー情報に基づいて特定する。
判別器の損失関数に正則化項を追加することで GAN 学習の目的関数を変更し、過去に重要な重みから大きく逸脱するパラメータの変化をペナルティ化する。
生成器や学習スケジュールを変更せずに、判別器に EWC および IS の正則化を適用することで、アーキテクチャの変更を最小限に抑える。
ベースライン GAN（例：DCGAN、WGAN-GP、SN-DCGAN）と同一のハイパーパramータおよび学習率を用い、判別器の損失関数に EWC/IS の損失項のみを追加する。
CelebA や CIFAR-10 といった画像データセットで Fréchet Inception Distance (FID) および Inception Score (ICP) を、MS COCO Captions のテキスト生成タスクでは BLEU および Self-BLEU スコアを用いて評価する。
TTUR、WGAN-GP、SN-DCGAN といった複数の GAN のバリエーションで訓練を行い、本手法の汎用性を評価する。

実験結果

リサーチクエスチョン

RQ1生成器の分布が進化することで生じる判別器の危険な忘れやすさから、GAN学習が本質的に継続的学習問題であると言えるか？
RQ2EWC や IS といった継続的学習手法が、GAN学習の安定化とモード崩壊の緩和に効果的に適用可能であるか？
RQ3判別器に EWC や IS の正則化を追加することで、画像およびテキスト生成ベンチマークにおける FID、ICP、BLEU スコアが向上するか？
RQ4本手法は、生成サンプルの品質と多様性の観点から、最先端の GAN 学習手法と比較して優れているか？
RQ5GAN が生成するデータは、従来のデータセットよりも継続的学習のためのより現実的なベンチマークとして機能できるか？

主な発見

判別器に EWC を適用することで、CelebA における FID は 12.52 から 10.92 に低下し、CIFAR-10 では 41.44 から 34.84 に低下し、画像の品質と多様性が向上した。
CIFAR-10 では、ICP が 6.97 ± 0.05 から 7.58 ± 0.07 に向上し、クラス表現の質とサンプル品質が向上した。
MS COCO Captions のテキスト生成タスクにおいて、EWC/IS + textGAN は BLEU-2 スコア 0.934 を達成し、ヴァニラ版 textGAN（0.926）および多数の最先端手法を上回った。
EWC/IS のバリエーションは BLEU-4 スコア 0.594 を達成し、ヴァニラ版 textGAN（0.567）を上回り、LeakGAN に近づいた一方で、自己BLEUスコアは 0.388（vs. 0.689）と低く抑えられ、より高い多様性を示した。
生成器のアーキテクチャや学習率に変更は加えず、EWC/IS の正則化項による計算コストの増加もわずかに抑えられた。
結果から、継続的学習正則化を用いた GAN 学習は、より安定した学習、モード崩壊の低減、画像およびテキスト生成タスクにおけるサンプル品質の向上を実現することが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。