Skip to main content
QUICK REVIEW

[論文レビュー] Maximum Entropy Generators for Energy-Based Models

Rithesh Kumar, Ozair, Sherjil|arXiv (Cornell University)|Jan 24, 2019
Anomaly Detection Techniques and Applications参考文献 46被引用数 62
ひとこと要約

MEG はエネルギーベースモデルの対数尤度勾配を近似するために、エネルギー関数とアモルタイズドニューラルジェネレータを同時に訓練し、ジェネレータ出力のエントロピー最大化と安定性のための勾配ペナルティを用いる。これによりシャープな画像サンプルを生成し、モード完全性をサポートし、競争力のある異常検知性能を示す。

ABSTRACT

Maximum likelihood estimation of energy-based models is a challenging problem due to the intractability of the log-likelihood gradient. In this work, we propose learning both the energy function and an amortized approximate sampling mechanism using a neural generator network, which provides an efficient approximation of the log-likelihood gradient. The resulting objective requires maximizing entropy of the generated samples, which we perform using recently proposed nonparametric mutual information estimators. Finally, to stabilize the resulting adversarial game, we use a zero-centered gradient penalty derived as a necessary condition from the score matching literature. The proposed technique can generate sharp images with Inception and FID scores competitive with recent GAN techniques, does not suffer from mode collapse, and is competitive with state-of-the-art anomaly detection techniques.

研究の動機と目的

  • EBM の訓練が難しい理由と対処法を動機づける、対数尤度勾配が計算不可能である点を扱う。
  • p_theta を近似するエネルギー関数とアモルタイズドサンプラーを同時に学習する共同フレームワークを提案する。
  • ジェネレータの出力のエントロピーを最大化し、p_G と p_theta を一致させ、訓練を安定化する。
  • ノンパラメトリック mutual information 推定器を活用してジェネレータのエントロピーを最大化する。
  • 基準法と比較してMEGが画像のシャープさ、モードカバレッジ、異常検知を改善することを示す。

提案手法

  • モデル分布 p_theta を潜在事前分布 z~p_z からサンプル G(z) を生成するニューラルジェネレータ G(w) に置換する。
  • KL(p_G||p_theta) を最小化する。これにより、ジェネレータのエントロピーとエネルギー評価を組み合わせたジェネレータ損失が生じる: L_G = -I_JSD(G(Z),Z) + E_theta[E(G(Z))].
  • エネルギー関数 E_theta を勾配によって訓練する: L_E = E_{x~p_D}[E_theta(x)] - E_{z~p_z}[E_theta(G(z))].
  • Belghazi ら(2018)および関連研究における I_JSD(G(Z),Z) を用いて、非パラメトリック mutual information 推定を通じてジェネレータのエントロピーを最大化する。
  • エネルギー関数の臨界点近傍にサンプルを保つよう、スコアマッチに触発されたゼロ中心の勾配ペナルティで訓練を安定化する。
  • 任意で潜在空間 MCMC(Metropolis-Hastings ステップを伴う MALA)を実行して、潜在空間の高密度領域へサンプリングを偏らせる。

実験結果

リサーチクエスチョン

  • RQ1データ空間の高コストな MCMC に依存せず、アモルタイズドニューラサンプラーはエネルギーベースモデルのネガティブフェーズ勾配を近似できるか。
  • RQ2ジェネレータ出力のエントロピーを最大化するとモード崩壊を防ぎ、すべてのデータモードを網羅できるか。
  • RQ3MEG フレームワークは競合力のある画像サンプルを生成し、モード多様性を犠牲にせずシャープさを維持できるか。
  • RQ4学習されたエネルギー関数は標準ベンチマークで異常検知に有用か。

主な発見

  • MEG は CIFAR-10 のサンプルを Inception Score および Fréchet Inception Distance で WGAN-GP と競合する水準で生成する。
  • MEG は 4-StackedMNIST の全モードを正確に捉え、KL 発散は複数のベースラインより低い。
  • 潜在空間 MALA サンプリングは視認空間 MCMC と比較して知覚的サンプル品質を向上させる。
  • MEG は KDD99 で強力な異常検知性能を達成し、最先端手法に匹敵する。
  • MEG は典型的な最大似然EBMよりもシャープでぼやけにくいサンプルを生み出し、モード崩壊を避ける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。