QUICK REVIEW

[论文解读] Uncertainty in the Variational Information Bottleneck

Alexander A. Alemi, Ian Fischer|arXiv (Cornell University)|Jul 2, 2018

Anomaly Detection Techniques and Applications参考文献 8被引用 65

一句话总结

论文表明变分信息瓶颈（VIB）在 FashionMNIST 上实现了校准预测和有效的分布外检测，而无需额外校准，通过对表示与速率的不确定性建模。

ABSTRACT

We present a simple case study, demonstrating that Variational Information Bottleneck (VIB) can improve a network's classification calibration as well as its ability to detect out-of-distribution data. Without explicitly being designed to do so, VIB gives two natural metrics for handling and quantifying uncertainty.

研究动机与目标

在本征不确定性、知识不确定性和分布外不确定性并存的情境下，推动对神经网络进行可靠的不确定性量化。
证明 VIB 能在不使用额外校准技术的情况下提供经过校准的预测。
展示 VIB 在标准数据集上对分布外检测的有效性及鲁棒性。

提出的方法

使用信息瓶颈的变分界来学习一个随机编码器 eθ(z|x) 和一个变分边缘分布 mφ(z)。
训练一个变分分类器 qψ(y|z)，从潜在编码 Z 预测标签。
优化一个界，最大化 E[log qψ(y|z)] − β E[log (eθ(z|x)/mφ(z))]，在准确性和速率之间取得平衡。
通过双随机性建模不确定性：Z 和 Y 的随机性，使预测具有均值和方差。
在训练和测试阶段使用蒙特卡洛采样来估计期望。

实验结果

研究问题

RQ1与确定性基线相比，VIB 是否能改善神经网络的校准？
RQ2在没有事后校准的情况下，VIB 是否能改进分布外数据的检测？
RQ3VIB 的不确定性度量（如 rate R 和 entropy H）如何与错误率和分布外检测性能相关？

主要发现

VIB 的校准优于基线的确定性分类器，降低了测试数据的过度自信。
在 FashionMNIST 上，VIB 的准确率大约为 92.8–92.9%，与基线和温度缩放基线相比，错误检测指标具有竞争力。
VIB 提供两种不确定性信号——rate (R) 和 entropy (H)——帮助分布外和错误检测，其中 R 在分布外检测中表现突出。
温度缩放仍然是一个强有力的事后方法，但 VIB 可以在不使用温度缩放的情况下改善校准和 OOD 检测，且在某些 OoD 信号下 R 可以优于 H。
VIB 的不确定性信号能够检测到显著和微妙的分布变化，包括 FashionMNIST 数据的镜像或旋转版本。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。