QUICK REVIEW

[論文レビュー] On Catastrophic Forgetting and Mode Collapse in Generative Adversarial Networks

Hoang Thanh-Tung, Truyen Tran|arXiv (Cornell University)|Jul 11, 2018

Generative Adversarial Networks and Image Synthesis被引用数 25

ひとこと要約

この論文は、生成対抗ネットワーク（GANs）が単一のターゲット分布の学習中ですら、壊滅的忘却（CF）を経験することを明らかにし、GANの学習を順次的学習問題として再定式化する。ここで、変化する生成器の分布が連続するタスクとして作用する。著者らは、CFが識別器の能力を損なうことで、実データポイントが広範な局所最大点として維持できず、その結果としてモード崩壊と収束不能が生じることを示し、勾配ペナルティ（R1、0GP）、モーメンタム最適化法、不均衡損失を提案することで、学習の安定化と一般化性能の向上を図る。

ABSTRACT

In this paper, we show that Generative Adversarial Networks (GANs) suffer from catastrophic forgetting even when they are trained to approximate a single target distribution. We show that GAN training is a continual learning problem in which the sequence of changing model distributions is the sequence of tasks to the discriminator. The level of mismatch between tasks in the sequence determines the level of forgetting. Catastrophic forgetting is interrelated to mode collapse and can make the training of GANs non-convergent. We investigate the landscape of the discriminator's output in different variants of GANs and find that when a GAN converges to a good equilibrium, real training datapoints are wide local maxima of the discriminator. We empirically show the relationship between the sharpness of local maxima and mode collapse and generalization in GANs. We show how catastrophic forgetting prevents the discriminator from making real datapoints local maxima, and thus causes non-convergence. Finally, we study methods for preventing catastrophic forgetting in GANs.

研究の動機と目的

GAN学習における壊滅的忘却（CF）を根本的問題として特定・分析すること、これは単一のターゲット分布を近似的に学習する場合でも成立する。
GANにおけるCF、モード崩壊、非収束の関係を調査し、GAN学習が単一タスク問題であるという仮定に疑問を呈すること。
CF下で、実データポイントが識別器の出力空間において安定な局所最大点とならなくなる理由を説明し、収束がどのように損なわれるかを解明すること。
既存のGAN学習手法（例：WGAN-GP、R1、0GP、モーメンタム最適化法）をCF防止の観点から評価すること。
実データポイントの表現を強化する新しい不均衡損失関数を提案し、計算コストをゼロに保ったまま実装すること。

提案手法

GAN学習を継続的学習問題として再定式化し、進化する生成器の分布が識別器にとっての新しいタスクとみなされるようにする。
識別器の出力空間における局所最大点（特に実データポイント付近）を特定し、その鋭さをモード崩壊と一般化性能の代理指標として測定する。
CFを検出するための方向的単調性指標を導入し、方向的単調性を示す識別器は均衡に収束できない。
ゼロ中心の勾配ペナルティ（R1および0GP）を適用し、実データポイントで勾配がゼロになるように制約を課し、識別器における広範な局所最大点を促進する。
実データに重みγ > 1を大きく設定した不均衡損失関数を提案し、実サンプルの識別器スコアが低くならないようにし、局所最小点にならないように防止する。
不均衡損失を既存の勾配ペナルティと組み合わせることで、さらに学習の安定化と一般化性能の向上を図る。

実験結果

リサーチクエスチョン

RQ1GAN学習は、単一のターゲット分布をモデル化する場合でも、壊滅的忘却を示すか？
RQ2GANにおける壊滅的忘却は、モード崩壊と非収束とどのように関連しているか？
RQ3識別器の出力空間における局所最大点の鋭さと幅は、モード崩壊と一般化にどのような役割を果たすか？
RQ4なぜ方向的単調性を示す識別器はGANの収束を妨げるのか？
RQ5WGAN-GP、R1、0GP、モーメンタム最適化法といった既存のGAN学習手法は、壊滅的忘却の防止メカニズムとして理解できるか？

主な発見

GAN学習は本質的に壊滅的忘却を経験する。これは、単一ターゲット設定であっても、訓練中に以前のデータ分布に関する識別器の知識が消去されるためである。
壊滅的忘却は、識別器において実データポイントが広範な局所最大点とならなくなるのを防ぎ、その結果として非収束とモード崩壊を引き起こす。
GANが良好な均衡に収束し、モード崩壊がない場合、実データポイントは識別器の出力において広範な局所最大点となる。鋭い最大点は、より深刻なモード崩壊と相関する。
方向的単調性を示す識別器（CFの兆候）は、安定な均衡に収束できず、CFが非収束の根本的原因であることを確認する。
勾配ペナルティ（R1、0GP）、モーメンタム最適化法、および提案された不均衡損失関数は、すべて実データポイントの最大点の安定性を維持または強化することで、CFを緩和する。
重みγ > 1の不均衡損失は、CIFAR-10においてInceptionスコアを著しく向上させ、スコアの分散を低減する。計算コストを追加せずに、品質と安定性の両方を向上させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。