Skip to main content
QUICK REVIEW

[论文解读] BatchBALD: Efficient and Diverse Batch Acquisition for Deep Bayesian Active Learning

Andreas Kirsch, Joost van Amersfoort|arXiv (Cornell University)|Jun 19, 2019
Machine Learning and Algorithms参考文献 34被引用 192
一句话总结

BatchBALD 提供一个可处理的、贪心的 1-1/e 近似采集函数,该函数通过对标签批次与模型参数之间的互信息进行建模,联合选择具有多样性的批量,从而在深度贝叶斯主动学习中提高数据效率,相较于 BALD。

ABSTRACT

We develop BatchBALD, a tractable approximation to the mutual information between a batch of points and model parameters, which we use as an acquisition function to select multiple informative points jointly for the task of deep Bayesian active learning. BatchBALD is a greedy linear-time $1 - \frac{1}{e}$-approximate algorithm amenable to dynamic programming and efficient caching. We compare BatchBALD to the commonly used approach for batch data acquisition and find that the current approach acquires similar and redundant points, sometimes performing worse than randomly acquiring data. We finish by showing that, using BatchBALD to consider dependencies within an acquisition batch, we achieve new state of the art performance on standard benchmarks, providing substantial data efficiency improvements in batch acquisition.

研究动机与目标

  • 通过贝叶斯神经网络的主动学习来提升深度学习的数据效率。
  • 扩展 BALD,通过考虑批内的依赖性和多样性来共同选择数据点的批次。
  • 提供一个具备保证的可处理算法,能够产生多样且信息丰富的批次。
  • 在标准图像数据集上展示改进的数据效率和训练速度。

提出的方法

  • 将 BatchBALD 定义为在给定数据批次的情况下,标签批次与模型参数之间的互信息。
  • 提出一个贪婪的、1-1/e 近似的算法来高效选择批次(算法1)。
  • 展示 BatchBALD 通过使用批信息的并集 μ*(⋃ yi ∩ ω) 来减少重叠,而非对独立 BALD 分数求和。
  • 推导一个蒙特卡洛估计器,用以利用 ω 的 k 个样本及联合熵的 MC 估计来计算 BatchBALD 分数。
  • 通过对 p(y1:n|ω) 进行分解,以及使用缓存/矩阵运算来处理更大批量,从而实现高效计算。
  • 给出复杂度界限,表明 BatchBALD 可处理(O(b c min{c^b, m} |D_pool| k))。

实验结果

研究问题

  • RQ1Does BatchBALD improve data efficiency by accounting for joint information and diversity within acquisition batches compared to naive BALD?
  • RQ2Can a greedy 1-1/e approximate BatchBALD batch selection achieve near-optimal performance with tractable computation?
  • RQ3How does BatchBALD perform on standard AL benchmarks (MNIST, EMNIST) and transfer learning (CINIC-10) relative to BALD and random acquisition?
  • RQ4What is the impact of batch size on diversity and training efficiency in deep Bayesian active learning?
  • RQ5What are practical implementation considerations (MC dropout consistency, reinitialization, and computation) that affect BatchBALD performance?

主要发现

  • BatchBALD 在采集规模增大时优于 BALD,能够在较大批量下仍保持强劲表现。
  • BatchBALD 产生更具多样性的获取数据,并在预测类别分布的多样性上带来更高的多样性(EMNIST 结果)。
  • 在 MNIST 上,BatchBALD 采集规模为 10 时接近理想 BALD 的采集规模为 1 的表现,且总体上比 size 1 的 BALD 更快。
  • BatchBALD 在 MNIST、EMNIST、CINIC-10 的转移学习实验中相对于 BALD 和随机获取提升数据效率。
  • 在复制数据场景中,naive BALD 批次可能表现较差,而 BatchBALD 对重复和数据复制具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。