Skip to main content
QUICK REVIEW

[論文レビュー] Uncertainty in Neural Networks: Approximately Bayesian Ensembling

Tim Pearce, Felix Leibfried|arXiv (Cornell University)|Oct 12, 2018
Reservoir Engineering and Simulation Methods参考文献 25被引用数 38
ひとこと要約

この論文は、事前分布からのサンプルを中心にニューラルネットワークの重みを正則化することでベイジアン推論を近似する、アンカードアンサンブルという手法を提案する。標準アンサンブルにパrameter正則化を適用することで、ベイジアン手法に近い不確実性推定を達成し、回帰、分類、強化学習のタスクにおいて標準アンサンブルを上回り、変分推論と同等の性能を示した。

ABSTRACT

Understanding the uncertainty of a neural network's (NN) predictions is essential for many purposes. The Bayesian framework provides a principled approach to this, however applying it to NNs is challenging due to large numbers of parameters and data. Ensembling NNs provides an easily implementable, scalable method for uncertainty quantification, however, it has been criticised for not being Bayesian. This work proposes one modification to the usual process that we argue does result in approximate Bayesian inference; regularising parameters about values drawn from a distribution which can be set equal to the prior. A theoretical analysis of the procedure in a simplified setting suggests the recovered posterior is centred correctly but tends to have an underestimated marginal variance, and overestimated correlation. However, two conditions can lead to exact recovery. We argue that these conditions are partially present in NNs. Empirical evaluations demonstrate it has an advantage over standard ensembling, and is competitive with variational methods.

研究の動機と目的

  • 実世界の応用(アクティブラーニングや敵対的耐性など)において不可欠な、深層ニューラルネットワークにおける不確実性の定量化の課題に取り組む。
  • 大規模モデルでは計算的に不可能なため、実用的なアンサンブル手法と原理的ベイジアン推論の間のギャップを埋める。
  • パrameter正則化を通じてニューラルネットワークにおけるベイジアン後退事後分布推定を近似する、スケーラブルで実装可能な手法を開発する。
  • アンカードアンサンブルが真の後退事後分布を回復する条件を理論的に分析し、標準アンサンブルおよび変分推論と比較してその性能を実験的に検証する。

提案手法

  • アンカードアンサンブルは、パラメータを事前分布から抽出したサンプルに引き寄せる正則化項を導入し、ランダム化MAPサンプリング(RMS)を実装する。
  • この手法は、事前分布からアンカーパラメータをサンプリングし、アンサンブル内の各ネットワークをこれらのアンカーを中心に正則化された損失関数を最小化するように訓練する。
  • 理論的分析では、多変量正規分布の仮定の下で、この手法は正しい後退事後平均を回復するが、周辺分散は低く見積もられ、相関は過大評価される。
  • 正確な後退事後分布回復は、2つの条件下で達成される:パラメータが完全に相関している場合、または周辺尤度分散が無限大である「外挿パラメータ」の場合。
  • 分類タスクへの応用を可能にするために、パラメータ空間の抽象化を用いて拡張された。
  • 実験的評価では、回帰、画像分類(CIFAR-10、MNIST)、センチメント分析(IMDb)、強化学習(FetchPush)の標準ベンチマークを用い、標準アンサンブルおよび変分推論と比較した。

実験結果

リサーチクエスチョン

  • RQ1標準アンサンブルに、事前分布からのサンプルを中心にパラメータを正則化するという単純な修正を加えることで、ベイジアン推論を近似する不確実性推定が得られるか?
  • RQ2アンカードアンサンブルが真の後退事後分布を正確に回復する理論的条件は何か?
  • RQ3アンカードアンサンブルは、多様なタスクにおける予測不確実性と精度の観点で、標準アンサンブルおよび変分推論と比べてどのように異なるか?
  • RQ4正確な後退事後分布回復のための理論的条件(完全な相関または無限大の分散)が、実際のニューラルネットワークでどの程度近似的に満たされているか?

主な発見

  • 可視化により、複数のタスクにおいて、アンカードアンサンブルがガウス過程や正確なベイジアン手法の予測分布に非常に近い結果を生成することが示された。
  • 特に分布外検出および一般化性能において、標準アンサンブルを著しく上回る不確実性推定性能を達成した。
  • CIFAR-10では、アンカードアンサンブルは変分推論と同等のテスト精度を達成したが、不確実性のキャリブレーションが優れていた。
  • FetchPush強化学習環境では、標準アンサンブルよりもより効果的な探索が可能になり、最終的な累積報酬が高くなった。
  • 実験的結果から、アンカードアンサンブルは回帰および分類タスクにおいて、最先端の変分推論手法と同等の性能を示した。
  • 理論的分析により、一般に分散は低く見積もられ、相関は過大評価されるが、後退事後分布の正確な回復に必要な2つの条件がニューラルネットワークで部分的に満たされていることが確認され、強力な実験的性能の裏付けが得られた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。