Skip to main content
QUICK REVIEW

[论文解读] Reliable Uncertainty Estimates in Deep Neural Networks using Noise Contrastive Priors

Danijar Hafner, Dustin Tran|arXiv (Cornell University)|Jul 24, 2018
Probabilistic and Robust Engineering Design被引用 52
一句话总结

本文提出噪声对比先验(NCPs),一种通过训练模型对分布外输入输出高不确定性来提升深度神经网络不确定性估计的方法。通过引入输入噪声和宽输出先验,NCPs显著提升了在航班延误数据集上的可靠性与可扩展性,相比先前方法大幅改善了不确定性校准效果。

ABSTRACT

Obtaining reliable uncertainty estimates of neural network predictions is a long standing challenge. Bayesian neural networks have been proposed as a solution, but it remains open how to specify the prior. In particular, the common practice of a standard normal prior in weight space imposes only weak regularities, causing the function posterior to possibly generalize in unforeseen ways on out-of-distribution inputs. We propose noise contrastive priors (NCPs). The key idea is to train the model to output high uncertainty for data points outside of the training distribution. NCPs do so using an input prior, which adds noise to the inputs of the current mini batch, and an output prior, which is a wide distribution given these inputs. NCPs are compatible with any model that represents predictive uncertainty, are easy to scale, and yield reliable uncertainty estimates throughout training. Empirically, we show that NCPs offer clear improvements as an addition to existing baselines. We demonstrate the scalability on the flight delays data set, where we significantly improve upon previously published results.

研究动机与目标

  • 为解决深度神经网络中不确定性估计不可靠的问题,特别是针对分布外输入的情况。
  • 克服贝叶斯神经网络中标准正态先验的局限性,后者施加了较弱的正则化,导致泛化行为不可预测。
  • 开发一种可扩展且有效的方法,使模型在面对训练分布外数据时能够表达高不确定性。
  • 提供一种与任何表示预测不确定性的模型兼容的先验机制,无需修改网络结构。
  • 在真实世界的大规模数据集(如航班延误数据集)上实证验证该方法的有效性与可扩展性。

提出的方法

  • 引入一种输入先验,通过在每个小批量中对输入添加噪声,以模拟分布外样本。
  • 将输出先界定为给定噪声输入下预测值的宽分布,以鼓励对这些输入输出高不确定性。
  • 使用噪声对比估计目标进行模型训练,通过在噪声输入上最大化不确定性来区分干净输入与噪声输入。
  • 将NCP损失与任何现有不确定性感知模型结合,实现与标准深度学习框架的兼容性。
  • 利用所得损失正则化后验分布,确保模型在分布外输入上能安全且可靠地泛化。
  • 通过避免复杂的后验近似或训练期间的额外推理步骤,保持计算效率。

实验结果

研究问题

  • RQ1一种简单且可扩展的先验机制是否能在不修改网络结构的前提下提升深度神经网络的不确定性估计?
  • RQ2与标准先验相比,噪声对比先验在降低分布外输入上的过度自信方面效果如何?
  • RQ3NCPs在真实世界大规模数据集上对不确定性校准和分布外检测性能的提升程度如何?
  • RQ4NCP方法是否与多种不确定性估计模型及训练范式兼容?
  • RQ5NCP能否实现端到端训练并扩展至大规模数据集,同时在整个训练过程中保持可靠的不确定性估计?

主要发现

  • NCPs在航班延误数据集上显著改善了不确定性校准效果,优于先前发表的结果。
  • 该方法通过提高对分布外输入的不确定性估计,增强了模型的可靠性,降低了过度自信。
  • NCPs可与任何表示预测不确定性的模型兼容,具备广泛的应用潜力。
  • 该方法在大规模数据集上表现出高效的可扩展性,展示了超越小规模基准测试的实际应用价值。
  • 使用输入噪声和宽输出先验可使训练和推理过程中的不确定性估计更加稳健和可预测。
  • 实证结果表明,将NCPs加入现有不确定性基线模型后,性能得到明显提升,证实其作为即插即用增强模块的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。