[论文解读] Deep Active Learning over the Long Tail
本文提出 FF-Active,一种基于表示空间的最远先核心集的池化主动学习方法,用于深度网络,在长尾、多轮设置中,相比随机采样和基于不确定性的(softmax)采样,在 MNIST、CIFAR-10 和 CIFAR-100 上实现显著的样本效率提升。
This paper is concerned with pool-based active learning for deep neural networks. Motivated by coreset dataset compression ideas, we present a novel active learning algorithm that queries consecutive points from the pool using farthest-first traversals in the space of neural activation over a representation layer. We show consistent and overwhelming improvement in sample complexity over passive learning (random sampling) for three datasets: MNIST, CIFAR-10, and CIFAR-100. In addition, our algorithm outperforms the traditional uncertainty sampling technique (obtained using softmax activations), and we identify cases where uncertainty sampling is only slightly better than random sampling.
研究动机与目标
- 在深度主动学习中通过一个长尾池设置提升标注效率的动机与目标。
- 利用数据集压缩的思路,通过表示空间的核心集来引导查询选择。
- 开发一种实用的查询策略,降低超参数敏感性并稳定早期阶段的性能。
提出的方法
- 训练一个初始的深度模型,然后在长尾设置中进行迭代的主动学习轮次。
- 在表示空间中对每类构建核心集,使用对 phi(x)(最后一层前的表示)的最远先遍历。
- 在每一轮中,通过贪心地选择未标记点使其到当前已标记表示的最小距离最大化来挑选一个批次。
- 将所提出的 FF-Active 与 softmax-response(不确定性采样)和随机采样在多个数据集上进行比较。
- 可选地讨论扩展,如伪标签或蒙特卡洛 dropout,以丰富表示并降低方差。
实验结果
研究问题
- RQ1在深度、长尾设置中,表示空间的最远先遍历是否能带来标签高效的主动学习?
- RQ2FF-Active 相较于不确定性采样和随机采样在标准图像数据集上的表现如何?
- RQ3在深度主动学习中,基于表示的核心集是否能在不进行大量超参数调优的情况下提供实际改进?
- RQ4合成长尾(更大规模的数据池)对查询效率有何影响?
主要发现
- FF-Active 在 MNIST、CIFAR-10 和 CIFAR-100 上相对于随机采样实现了显著的标签效率提升。
- FF-Active 通常优于传统的基于 softmax 的不确定性采样,尤其在初始主动轮之后。
- 在 MNIST 中,FF-Active 与 SR 初始表现相似,随着标注量增加,FF-Active 保持优势。
- 在 CIFAR-10 和 CIFAR-100 中,FF-Active 相对于 Random 呈现明显优势,SR 初期表现相当但后期下降。
- 合成的更长长尾(扩大的数据池)放大了 FF-Active 相对于 Random 和 SR 的优势。
- 该方法证明了在深度网络中,表示空间的最远先核心集能够有效引导标注数据的选择。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。