[论文解读] Bayesian Convolutional Neural Networks
本文提出一种基于变分推断的贝叶斯卷积神经网络,采用归一化的 Softplus 输出,以联合估计分类任务中的认知不确定性与随机不确定性。该方法在 MNIST、CIFAR-10 和 CIFAR-100 上的性能与频率学派模型相当,同时自然地整合了不确定性量化与正则化。
We introduce a novel uncertainty estimation for classification tasks for Bayesian convolutional neural networks with variational inference. By normalizing the output of a Softplus function in the final layer, we estimate aleatoric and epistemic uncertainty in a coherent manner. The intractable posterior probability distributions over weights are inferred by Bayes by Backprop. Firstly, we demonstrate how this reliable variational inference method can serve as a fundamental construct for various network architectures. On multiple datasets in supervised learning settings (MNIST, CIFAR-10, CIFAR-100), this variational inference method achieves performances equivalent to frequentist inference in identical architectures, while the two desiderata, a measure for uncertainty and regularization are incorporated naturally. Secondly, we examine how our proposed measure for aleatoric and epistemic uncertainties is derived and validate it on the aforementioned datasets.
研究动机与目标
- 开发一种可靠的变分推断方法,用于贝叶斯卷积神经网络,以实现一致的不确定性估计。
- 在单一深度学习框架中自然地整合认知不确定性与随机不确定性估计。
- 证明所提出的方法在标准视觉基准测试上达到与标准(频率学派)模型相当的性能。
- 在真实世界数据集(如 MNIST、CIFAR-10 和 CIFAR-100)上验证不确定性估计的有效性。
提出的方法
- 该方法采用 Bayes-by-Backprop 来近似网络权重的不可计算后验分布。
- 在最后一层应用归一化的 Softplus 函数,以生成校准后的不确定性估计。
- 通过 Softplus 输出的尺度建模随机不确定性,捕捉数据驱动的噪声。
- 通过变分推断估计权重后验方差,从而推断认知不确定性。
- 归一化处理确保了在不同预测置信度水平下,不确定性估计的稳定与一致。
- 该框架在多种网络架构上进行了应用,证明了其在不同网络设计中的泛化能力。
实验结果
研究问题
- RQ1在贝叶斯卷积神经网络中,变分推断能否在统一框架下可靠地估计认知不确定性与随机不确定性?
- RQ2所提出的不确定性估计方法是否在图像分类任务中保持与标准(频率学派)模型相当的性能?
- RQ3估计的不确定性在基准数据集上与实际预测可靠性之间的相关性如何?
- RQ4该方法是否能在不降低性能的前提下,推广至不同网络架构?
主要发现
- 所提出的贝叶斯卷积神经网络在 MNIST、CIFAR-10 和 CIFAR-100 上的分类性能与标准(频率学派)模型相当。
- 通过变分后验自然地引入正则化,提升了泛化能力,且无需额外超参数。
- 认知不确定性与随机不确定性被一致地估计,并在所有测试数据集中保持良好校准。
- 归一化的 Softplus 输出确保了不确定性估计的稳定性,避免了预测中的过度自信。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。