Skip to main content
QUICK REVIEW

[论文解读] Deep Batch Active Learning by Diverse, Uncertain Gradient Lower Bounds

Jordan T. Ash, Chicheng Zhang|arXiv (Cornell University)|Jun 9, 2019
Machine Learning and Algorithms参考文献 46被引用 280
一句话总结

BADGE 通过将基于梯度的不确定性与多样性相结合来选择批次,使用对梯度嵌入的 k-means++ 来请求标签,无需额外的超参数,在跨架构和批量大小上显示出鲁棒的性能。

ABSTRACT

We design a new algorithm for batch active learning with deep neural network models. Our algorithm, Batch Active learning by Diverse Gradient Embeddings (BADGE), samples groups of points that are disparate and high-magnitude when represented in a hallucinated gradient space, a strategy designed to incorporate both predictive uncertainty and sample diversity into every selected batch. Crucially, BADGE trades off between diversity and uncertainty without requiring any hand-tuned hyperparameters. We show that while other approaches sometimes succeed for particular batch sizes or architectures, BADGE consistently performs as well or better, making it a versatile option for practical active learning problems.

研究动机与目标

  • 推动在实际场景中对深度神经网络进行高效标签学习。
  • 开发一种在不同架构、批量大小和数据集上均能工作、且无手动调参的超参数的批量主动学习算法。
  • 通过基于梯度的表示将不确定性与多样性编码到批量选择中。
  • 提供一种可扩展的采样方法,避免代价高昂的概率采样,同时保持批次质量。

提出的方法

  • 对每个未标记样本,计算梯度嵌入:对最终层的交叉熵损失求梯度,使用模型当前预测的标签作为真实标签的代理。
  • 将梯度嵌入的长度作为不确定性和潜在更新幅度的代理。
  • 在梯度嵌入集合上使用 k-means++ 初始化来选择批次,以在批点之间促进高幅度与多样性。
  • 迭代地对选中的批点请求标签,重新训练模型,并重复进行 T 次迭代。
  • 证明在常见网络结构下,梯度嵌入范数下界于最终层的真实梯度范数。
  • 将 BADGE 与多种基线在多种架构(MLP、ResNet、VGG)及数据集(SVHN、CIFAR-10、MNIST、OpenML 数据集)上进行比较。

实验结果

研究问题

  • RQ1BADGE 是否在不同架构、批量大小和数据集上稳定地优于或达到最先进的批量主动学习方法?
  • RQ2一个无超参数的、基于梯度嵌入的方法是否能够在批次中有效捕捉不确定性与多样性?
  • RQ3梯度嵌入的 k-means++ 采样是否在计算上高效且比复杂的采样器如 k-DPP 更稳健?
  • RQ4在实际深度学习环境中,BADGE 相对于代表性采样(多样性)和不确定性采样基线的表现如何?

主要发现

  • BADGE 在架构、批量大小和数据集设置上始终与最佳基线同等或更优。
  • 梯度嵌入提供了对不确定性的保守度量及潜在更新方向,促进有效的批量选择。
  • k-means++ 在梯度嵌入上的结果产生多样且幅度高的批次,等同或优于 k-DPP 采样,同时运行时间更短。
  • 多样性的方法单独在复杂数据或有限架构先验下可能失效,而 BADGE 通过结合不确定性与多样性维持鲁棒性。
  • 在实验中,BADGE 常常与 coreset、margin、entropy 及随机基线的表现相当或更好,尤其在较小的批量大小与卷积架构时。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。