Skip to main content
QUICK REVIEW

[論文レビュー] MINE: Mutual Information Neural Estimation

Mohamed Ishmael Belghazi, Aristide Baratin|arXiv (Cornell University)|Jan 12, 2018
Adversarial Robustness in Machine Learning被引用数 305
ひとこと要約

双KL発散表現を用いたニューラル推定器(MINE)を導入。高次元にもスケーラブルでバックプロパゲーションで訓練可能、GANs・ALI・情報ボトルネックへの応用。

ABSTRACT

We argue that the estimation of mutual information between high dimensional continuous random variables can be achieved by gradient descent over neural networks. We present a Mutual Information Neural Estimator (MINE) that is linearly scalable in dimensionality as well as in sample size, trainable through back-prop, and strongly consistent. We present a handful of applications on which MINE can be used to minimize or maximize mutual information. We apply MINE to improve adversarially trained generative models. We also use MINE to implement Information Bottleneck, applying it to supervised classification; our results demonstrate substantial improvement in flexibility and performance in these settings.

研究の動機と目的

  • 高次元連続変数の相互情報を推定する課題を動機づけ、解決する。
  • Donsker-Varadhan および f-divergence 双対表現に基づくニューラル推定器(MINE)を提案する。
  • MINE の強い一貫性と良好なサンプル複雑さを実証する。
  • GANs のモード崩壊緩和、ALI の再構成の向上、連続情報ボトルネック手法を可能にする。

提案手法

  • KL-発散の双対関数として機能する X と Z 上のニューラルネットワーク T_theta を定義する。
  • Bound I(X;Z) ≥ E_{P_XZ}[T_theta] − log E_{P_X ⊗ P_Z}[e^{T_theta}] を用いる。
  • P_{XZ} からのミニバッチサンプルと P_X ⊗ P_Z からのサンプルを用いて theta を最適化し I(X;Z) を推定する。
  • 分母の SGD 勾配バイアスに対処するため移動平均バイアス補正を用いる。
  • MINE(および MINE-f)を推定量として提案し、バイアス補正と実践的訓練の詳細を議論する。
  • 強い一貫性(近似補題と推定補題)とサンプル複雑さの境界といった理論的結果を示す。

実験結果

リサーチクエスチョン

  • RQ1高次元変数間の相互情報をニューラルネットワークベースの双表現で正確に推定できるか?
  • RQ2MINE は強い一貫性をもち、サンプル複雑さはどうなるか?
  • RQ3実用的な学習設定(GAN、ALI、IB)で MINE を用いて相互情報を最大化または最小化することは効果的か?

主な発見

  • MINE は強い一貫性を持つ:十分なネットワーク容量とサンプルがあれば I(X;Z) を任意に良く近似できる。
  • 経験的には低次元で真の MI に密接に一致し、高次元で非パラメトリックな k-NN を上回る。
  • MINE による相互情報の最大化は GAN のモードカバレッジと ALI の再構成を改善し、モード崩壊の緩和に寄与する。
  • MINE は連続情報ボトルネックの実装を可能にし、いくつかの設定で変分ボトルネックのベースラインを上回る。
  • Stacked MNIST で MINE はデータ分布への競合的 KL 発散とともに完全なモードカバレッジを達成。
  • Permutation-invariant MNIST における MINE ベースの IB 実験はベースラインと比較して誤分類率が有利。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。