[論文レビュー] Discriminator Rejection Sampling
本稿では、訓練済みのGAN識別器を再帰的サンプリングとして用いることで、生成されたサンプルを改善するpost-processing手法である識別器拒否サンプリング(DRS)を提案する。識別器の信頼度スコアを活用することで、ImageNet上でのFIDとインセプションスコアが顕著に向上し、改善されたSAGANベースラインにおいてインセプションスコア76.08、FID13.75を達成した。
We propose a rejection sampling scheme using the discriminator of a GAN to approximately correct errors in the GAN generator distribution. We show that under quite strict assumptions, this will allow us to recover the data distribution exactly. We then examine where those strict assumptions break down and design a practical algorithm - called Discriminator Rejection Sampling (DRS) - that can be used on real data-sets. Finally, we demonstrate the efficacy of DRS on a mixture of Gaussians and on the SAGAN model, state-of-the-art in the image generation task at the time of developing this work. On ImageNet, we train an improved baseline that increases the Inception Score from 52.52 to 62.36 and reduces the Frechet Inception Distance from 18.65 to 14.79. We then use DRS to further improve on this baseline, improving the Inception Score to 76.08 and the FID to 13.75.
研究の動機と目的
- 敵対的訓練を行っても、GAN生成器が真のデータ分布を完全に一致させられないという継続的な問題に対処すること。
- 訓練済み識別器に、生成器の分布誤差を是正できる有用な情報が残っているかどうかを調査すること。
- 生成器の再訓練なしに、実用的でpost-trainingの方法としての性能向上を図ること。
- 最新のGANを用いて、合成されたガウス混合分布および実世界のImageNetデータ上で、本手法の実証的妥当性を検証すること。
提案手法
- 本手法は、訓練済み識別器の出力を再帰的サンプリングのスコア関数として用い、生成サンプルの信頼度に基づいて受容または拒否する。
- 動的しきい値戦略を適用し、各バッチにおける識別器スコアの80百分位数を受容しきい値として設定する。
- 理論的裏付けは、識別器が最適である場合に真のデータ分布の正確な回復が可能であるという厳密な仮定の下でなされる。
- 実用的応用においては、有限なモデル容量や非理想な最適化といった理論的仮定の破綻を考慮する。
- とくにヘッジ損失を用いる場合でも再帰的サンプリングに適合させるために、識別器の上流にシグモイド出力層を追加する。
- 本手法は訓練後処理として適用され、生成器や学習プロセスに何ら変更を加える必要がない。
実験結果
リサーチクエスチョン
- RQ1再訓練なしに、訓練済み識別器を用いてGAN生成器の分布誤差を是正できるか?
- RQ2どのような理論的条件下で識別器が真のデータ分布の正確な回復を可能にするか?
- RQ3理論的仮定の違反が、実用的な再帰的サンプリングスキームの性能にどのように影響するか?
- RQ4DRSは、ImageNetのような実世界のデータセットにおいて、どの程度サンプル品質を向上させられるか?
主な発見
- ImageNet上では、DRSによりインセプションスコアが改善されたSAGANベースラインの62.36から76.08に向上し、FIDは14.79から13.75に低下した。
- ベースライン比で、インセプションスコアは23.5%の相対的向上、FIDは12.5%の相対的低下を達成した。
- 高い受容確率を示したサンプルは、一貫して視覚的に整合性があり、明確な物体クラスとして識別可能であった。
- 再帰的サンプリングプロセスでは、潜在空間内挿値に沿って受容確率が単調に減少する傾向が示され、識別器が意味のある品質信号を符号化していることが示唆された。
- 定性的な分析により、高受容サンプルは低受容サンプルと比較してより現実的でノイズが少なかった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。