QUICK REVIEW

[論文レビュー] On catastrophic forgetting in Generative Adversarial Networks

Hoang Thanh-Tung, Truyen Tran|arXiv (Cornell University)|Jul 11, 2018

Generative Adversarial Networks and Image Synthesis参考文献 14被引用数 5

ひとこと要約

この論文は、生成対抗ネットワーク（GANs）が、モデルの自己変化する分布に伴う逐次的タスクのシフトによって、判別器が徐々に本物のデータ分布を忘却するという、壊滅的忘却を示している。著者らは、この忘却をモード崩壊と収束しない学習と関連付け、本物のデータポイントが、忘却が最小限に抑えられた場合にのみ、判別器の出力において鋭い局所最大値として現れることを示している。また、この問題を緩和する手法を提案している。

ABSTRACT

In this paper, we show that Generative Adversarial Networks (GANs) suffer from catastrophic forgetting even when they are trained to approximate a single target distribution. We show that GAN training is a continual learning problem in which the sequence of changing model distributions is the sequence of tasks to the discriminator. The level of mismatch between tasks in the sequence determines the level of forgetting. Catastrophic forgetting is interrelated to mode collapse and can make the training of GANs non-convergent. We investigate the landscape of the discriminator's output in different variants of GANs and find that when a GAN converges to a good equilibrium, real training datapoints are wide local maxima of the discriminator. We empirically show the relationship between the sharpness of local maxima and mode collapse and generalization in GANs. We show how catastrophic forgetting prevents the discriminator from making real datapoints local maxima, and thus causes non-convergence. Finally, we study methods for preventing catastrophic forgetting in GANs.

研究の動機と目的

GANsが単一のターゲット分布に訓練されても、壊滅的忘却を示すかどうかを調査すること。
GAN学習中の変化するモデル分布の順序が、判別器にとって継続的学習問題をどのように構成するかを分析すること。
GANsにおける壊滅的忘却、モード崩壊、収束しない学習の間の関係を理解すること。
判別器の出力の局所最大値の性質を分析し、本物のデータポイントが局所最大値となる条件を同定すること。
GANsにおける壊滅的忘却を防ぐための手法を開発・評価すること

提案手法

各進化する生成器の分布が判別器にとって新たなタスクを表す継続的学習プロセスとしてGAN学習をモデル化すること。
異なるGANバージョンにおける判別器の出力の局所最大値を特定するために、その出力の局所最大値の様相を分析すること。
本物のデータポイント周辺の局所最大値の鋭さを測定し、モード崩壊や汎化性能と相関させること。
実験的分析を用いて、判別器に広い局所最大値が存在しないことと、壊滅的忘却および収束しない学習の間の関係を特定すること。
判別器の学習を安定化させ、忘却を軽減するための正則化または訓練戦略を提案・評価すること

実験結果

リサーチクエスチョン

RQ1GANsにおいて、単一のターゲット分布に訓練されても、壊滅的忘却はどの程度発生するのか？
RQ2GAN学習中の進化する生成器の分布の順序が、判別器が本物のデータを記憶する能力にどのように影響するのか？
RQ3判別器の出力における局所最大値の鋭さと、モード崩壊や汎化性能の間にはどのような関係があるのか？
RQ4なぜ壊滅的忘却がGANsにおける収束しない学習を引き起こすのか？
RQ5GANsにおける壊滅的忘却を防ぐための手法を設計でき、学習の安定性を向上させることができるか？

主な発見

GAN学習は本質的に壊滅的忘却を伴い、生成器の出力の逐次的シフトに伴い、判別器が本物のデータ分布を徐々に忘却する。
本物の訓練データポイントが、判別器の出力において広い局所最大値として現れるのは、壊滅的忘却が最小限に抑えられた場合に限る。
本物のデータポイント周辺の局所最大値の鋭さは、GANsにおけるモード崩壊および劣悪な汎化性能と強く相関している。
壊滅的忘却は、広い局所最大値の形成を妨げ、直接的に収束しない学習ダイナミクスに寄与している。
本論文は、忘却の緩和による判別器の学習の局所最大値の安定化が、より安定的かつ収束するGAN学習をもたらすと特定している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。