QUICK REVIEW

[論文レビュー] Dropout as a Bayesian Approximation: Representing Model Uncertainty in Deep Learning

Yarin Gal, Zoubin Ghahramani|arXiv (Cornell University)|Jun 6, 2015

Gaussian Processes and Bayesian Inference参考文献 40被引用数 2,616

ひとこと要約

本論文は、深層ニューラルネットワークにおけるドロップアウトが深いガウス過程へのベイズ近似として機能し、実用的な不確実性推定（MCドロップアウトによる）を可能にすると同時に、回帰・分類・強化学習タスク全般で予測対数尤度とRMSEを向上させることを示している。

ABSTRACT

Deep learning tools have gained tremendous attention in applied machine learning. However such tools for regression and classification do not capture model uncertainty. In comparison, Bayesian models offer a mathematically grounded framework to reason about model uncertainty, but usually come with a prohibitive computational cost. In this paper we develop a new theoretical framework casting dropout training in deep neural networks (NNs) as approximate Bayesian inference in deep Gaussian processes. A direct result of this theory gives us tools to model uncertainty with dropout NNs -- extracting information from existing models that has been thrown away so far. This mitigates the problem of representing uncertainty in deep learning without sacrificing either computational complexity or test accuracy. We perform an extensive study of the properties of dropout's uncertainty. Various network architectures and non-linearities are assessed on tasks of regression and classification, using MNIST as an example. We show a considerable improvement in predictive log-likelihood and RMSE compared to existing state-of-the-art methods, and finish by using dropout's uncertainty in deep reinforcement learning.

研究の動機と目的

深層学習における標準的な予測性能とともに、モデル不確実性を表現する必要性を動機づける。
ドロップアウトと深いガウス過程におけるベイズ推論との理論的な関連を提案する。
既存のドロップアウト神経ネットワークから不確実性を抽出・定量化する実用的手法を開発する。
回帰、分類（MNIST）、および強化学習タスクにおける不確実性推定を実証的に評価する。

提案手法

ドロップアウトを、重み行列を変分分布で扱う確率的深いガウス過程への近似として位置づける。
重み行列を各層で行ベースのベルヌーイドロップを用いてドロップアウトを模倣する変分分布 q(ω) を用いる。
ドロップアウトをGP後方推論に整合させるKL発散最小化目的を導出する（式4）。
MCドロップアウトにより予測的不確実性を表現し、T回の確率的フォワードパスを平均する（式6）。
MCサンプルから予測平均と分散を計算する式を提供し、モデルの精度τをドロップアウトのハイパーパラメータと関連付ける（式7）。

実験結果

リサーチクエスチョン

RQ1ドロップアウトはどのようにベイズ的枠組みの中で解釈でき、深層ネットワークのモデル不確実性を定量化できるか。
RQ2MCドロップアウトは、予測対数尤度とRMSEの点で、他の不確実性推定手法とタスク横断でどのように比較されるか。
RQ3ドロップアウト由来の不確実性は、強化学習や他の不確実性依存の設定で意思決定を改善できるか。

主な発見

ドロップアウトはベイズ近似として解釈でき、モデルを統合することで意味のある不確実性推定を生み出す。
MCドロップアウトは、複数のデータセットにおいて、最先端の不確実性手法のいくつかと比較して予測対数尤度とRMSEを改善する。
ドロップアウト由来の不確実性推定は、分類（例：MNIST）で有用性が示され、強化学習シナリオで有益である。
同じドロップアウト対応ネットワークで複数の確率的フォワードパスを実行することで、推論時の計算コストを増やすことなく不確実性を得られる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。