QUICK REVIEW

[論文レビュー] Reliable Uncertainty Estimates in Deep Neural Networks using Noise Contrastive Priors

Danijar Hafner, Dustin Tran|arXiv (Cornell University)|Jul 24, 2018

Probabilistic and Robust Engineering Design被引用数 52

ひとこと要約

本稿では、分布外入力に対して高い不確実性を出力するようにモデルを訓練することにより、深層ニューラルネットワークにおける不確実性推定を向上させるNoise Contrastive Priors (NCPs) を提案する。入力ノイズと広範な出力事前分布を用いることで、信頼性とスケーラビリティが向上し、従来の手法と比較してフライト遅延データセットにおいて不確実性のキャリブレーションが著しく改善される。

ABSTRACT

Obtaining reliable uncertainty estimates of neural network predictions is a long standing challenge. Bayesian neural networks have been proposed as a solution, but it remains open how to specify the prior. In particular, the common practice of a standard normal prior in weight space imposes only weak regularities, causing the function posterior to possibly generalize in unforeseen ways on out-of-distribution inputs. We propose noise contrastive priors (NCPs). The key idea is to train the model to output high uncertainty for data points outside of the training distribution. NCPs do so using an input prior, which adds noise to the inputs of the current mini batch, and an output prior, which is a wide distribution given these inputs. NCPs are compatible with any model that represents predictive uncertainty, are easy to scale, and yield reliable uncertainty estimates throughout training. Empirically, we show that NCPs offer clear improvements as an addition to existing baselines. We demonstrate the scalability on the flight delays data set, where we significantly improve upon previously published results.

研究の動機と目的

深層ニューラルネットワークにおける信頼性の低い不確実性推定、特に分布外入力に対する課題に対処すること。
ベイジアンニューラルネットワークにおける標準的な正規事前分布の限界を克服すること。標準的な正規事前分布は弱い正則性を課し、一般化が予測不能になる。
訓練分布外のデータに対して不確実性を高めるよう促す、スケーラブルで効果的な手法を開発すること。
アーキテクチャの変更を必要とせず、予測不確実性を表現する任意のモデルと互換性を持つ事前分布メカニズムを提供すること。
実世界の大規模データセット（例：フライト遅延）において、本手法の有効性とスケーラビリティを実証的に検証すること。

提案手法

ミニバッチ内での入力にノイズを追加する入事前分布を導入し、分布外サンプルをシミュレートする。
ノイズ付き入力に対する予測の広範な分布として出事前分布を定義し、このような入力に対して高い不確実性を促す。
ノイズのない入力とノイズ付き入力の区別を、後者における不確実性の最大化によって行う、ノイズ対比推定の目的関数を用いてモデルを訓練する。
任意の既存の不確実性対応モデルとNCP損失を統合し、標準的なディープラーニングフレームワークと互換性を保つ。
得られた損失関数を用いて事後分布を正則化し、モデルが分布外入力に対して安全かつ信頼性高く一般化できるようにする。
訓練中に複雑な事後分布の近似や追加の推論ステップを避けることで、計算効率を維持する。

実験結果

リサーチクエスチョン

RQ1単純でスケーラブルな事前分布メカニズムは、アーキテクチャの変更なしに、深層ニューラルネットワークにおける不確実性推定を改善できるか？
RQ2ノイズ対比事前分布は、標準的な事前分布と比較して、分布外入力における過信の低減にどの程度効果的か？
RQ3NCPsは、実世界の大規模データセットにおいて、不確実性キャリブレーションと分布外検出性能をどの程度向上させるか？
RQ4NCPsは、多様な不確実性推定モデルや訓練パラダイムと互換性を持つか？
RQ5NCPsはエンドツーエンドで訓練可能であり、大規模データセットにスケーリング可能であり、訓練全体を通して信頼性の高い不確実性推定を維持できるか？

主な発見

NCPsはフライト遅延データセットにおいて不確実性キャリブレーションを著しく改善し、以前に発表された結果を上回る。
本手法は、分布外入力に対して不確実性推定値を高めることで、モデルの信頼性を向上させ、過信を低減する。
NCPsは、予測不確実性を表現する任意のモデルと互換性があるため、アーキテクチャを問わず広範に適用可能である。
本手法は大規模データセットに効率的にスケーリングでき、小規模ベンチマークを超えた実用的価値を示している。
入力ノイズと広範な出力事前分布の使用により、訓練および推論時によりロバストで予測可能な不確実性推定が可能になる。
実験的結果から、既存の不確実性ベースラインにNCPsを追加することで明確な改善が得られ、その有効性がプラグイン型の強化として確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。