Skip to main content
QUICK REVIEW

[論文レビュー] Improved Contrastive Divergence Training of Energy Based Models

Yilun Du, Shuang Li|arXiv (Cornell University)|Dec 2, 2020
Generative Adversarial Networks and Image Synthesis参考文献 56被引用数 29
ひとこと要約

この論文は、エネルギー関数モデルにおける対照的勾配降下法の訓練を、これまで無視されてきた勾配項を厳密に推定することで、単純ながらも効果的な改善を提案する。この勾配項の推定により訓練の安定性が向上し、自己注意機構や層正則化などの現代的なディープラーニングコンponentsの使用が可能になる。本手法は自動微分と最近傍エントロピー推定器を用いてこの項を効率的に計算し、新しい目的関数や複雑なアーキテクチャを導入することなく、画像生成、OOD検出、構成的生成のタスクにおいて、サンプル品質、ロバスト性、安定性の向上を実現する。

ABSTRACT

Contrastive divergence is a popular method of training energy-based models, but is known to have difficulties with training stability. We propose an adaptation to improve contrastive divergence training by scrutinizing a gradient term that is difficult to calculate and is often left out for convenience. We show that this gradient term is numerically significant and in practice is important to avoid training instabilities, while being tractable to estimate. We further highlight how data augmentation and multi-scale processing can be used to improve model robustness and generation quality. Finally, we empirically evaluate stability of model architectures and show improved performance on a host of benchmarks and use cases,such as image generation, OOD detection, and compositional generation.

研究の動機と目的

  • エネルギー関数モデルにおける対照的勾配降下法の訓練不安定性を解消し、現代のディープラーニングコンponentsの使用を制限している要因を是正すること。
  • 対照的勾配降下法の目的関数においてこれまで無視されてきた勾配項が、数値的に有意であり、訓練安定性に不可欠であることを示すこと。
  • この勾配項を効率的に推定できることを示し、自己注意機構、層正則化、長時間の訓練が、スペクトル正規化や勾配クリッピングなしで可能になること。
  • データ拡張とマルチスケールエネルギー評価を用いてMCMCの混合性とサンプル多様性を向上させること。
  • 画像生成、OOD検出、構成的生成のベンチマークにおいて、本手法の実証的有効性を検証すること。

提案手法

  • エネルギー関数が更新される際のMCMCサンプリングプロセスの変化に起因する、従来無視されてきた勾配項を推定する。
  • エネルギー関数の勾配を自動微分で計算し、MCMCサンプルのエントロピーを最近傍エントロピー推定器で近似することで、低分散かつ実行可能な全勾配の推定を可能にする。
  • MCMCチェーンの混合性を高めるために、意味的に意味のある摂動としてデータ拡張を適用し、多様なネガティブサンプルを生成する。
  • マルチスケールエネルギー評価を導入し、サンプリング中に粗いと細かい複数の解像度でエネルギーを計算することで、生成画像の空間的整合性を向上させる。
  • 本手法は標準的なEBM訓練と完全に互換性があり、補助ネットワーク、追加目的関数、アーキテクチャ変更を一切必要としない。
  • 本手法はCelebA-HQ や LSUN Bedroom などのベンチマークで、エンドツーエンドに適用され、改善された安定性とサンプル品質を実現したエネルギー関数モデルの訓練に成功している。

実験結果

リサーチクエスチョン

  • RQ1対照的勾配降下法の訓練において無視されてきた勾配項は、数値的に有意であり、訓練安定性の観点で推定する価値があるか?
  • RQ2高分散推定器や補助ネットワークを導入せずに、この勾配項を効率的に推定できるか?
  • RQ3この項を含めることで、自己注意機構や層正則化といった現代的なディープラーニングコンponentsをEBM訓練に導入できるか?
  • RQ4データ拡張とマルチスケールエネルギー評価は、MCMCの混合性とサンプル多様性を向上させられるか?
  • RQ5改善された訓練安定性は、複数のベンチマークにおいて生成品質とロバスト性の向上をもたらすか?

主な発見

  • 無視されてきた勾配項は全体の訓練勾配に顕著な寄与を示し、特に深層アーキテクチャを用いる際の訓練不安定性を回避するために不可欠である。
  • 自動微分と最近傍エントロピー推定器を用いたこの項の推定は、実行可能かつ効果的であり、スペクトル正規化や勾配クリッピングなしで安定した訓練を可能にする。
  • 本手法により、従来不安定さのため避けてきた自己注意機構や層正則化をEBMアーキテクチャに組み込むことが可能になった。
  • 意味的に意味のある摂動としてのデータ拡張は、MCMCの混合性とサンプル多様性を顕著に向上させ、より現実的な生成を実現する。
  • マルチスケールエネルギー評価は、MCMCプロセスを変更せずに生成画像の空間的整合性を向上させ、より高品質なサンプルを生成する。
  • CelebA-HQ では、構成的生成タスクにおいて、IGEBM や JVAE のベースラインと比較して、属性回復精度が最大15%向上した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。