Skip to main content
QUICK REVIEW

[论文解读] A Strategy for an Uncompromising Incremental Learner

Ragav Venkatesan, Hemanth Venkateswara|arXiv (Cornell University)|May 2, 2017
Domain Adaptation and Few-Shot Learning参考文献 29被引用 41
一句话总结

本文提出了一种严格的策略,通过‘幻象采样’实现无妥协的增量学习——该方法利用生成模型和知识蒸馏,生成带有正确标签的合成数据,以防止灾难性遗忘。该方法使深度神经网络能够在不访问历史数据的情况下学习新类别,在严格遵循增量学习约束的基准数据集上实现了最先进性能。

ABSTRACT

Multi-class supervised learning systems require the knowledge of the entire range of labels they predict. Often when learnt incrementally, they suffer from catastrophic forgetting. To avoid this, generous leeways have to be made to the philosophy of incremental learning that either forces a part of the machine to not learn, or to retrain the machine again with a selection of the historic data. While these hacks work to various degrees, they do not adhere to the spirit of incremental learning. In this article, we redefine incremental learning with stringent conditions that do not allow for any undesirable relaxations and assumptions. We design a strategy involving generative models and the distillation of dark knowledge as a means of hallucinating data along with appropriate targets from past distributions. We call this technique, phantom sampling.We show that phantom sampling helps avoid catastrophic forgetting during incremental learning. Using an implementation based on deep neural networks, we demonstrate that phantom sampling dramatically avoids catastrophic forgetting. We apply these strategies to competitive multi-class incremental learning of deep neural networks. Using various benchmark datasets and through our strategy, we demonstrate that strict incremental learning could be achieved. We further put our strategy to test on challenging cases, including cross-domain increments and incrementing on a novel label space. We also propose a trivial extension to unbounded-continual learning and identify potential for future development.

研究动机与目标

  • 在禁止访问数据或对过去数据重新训练的严格约束下,重新定义增量学习。
  • 在不放宽核心假设的前提下,解决多类别增量学习中的灾难性遗忘问题。
  • 在保留先前学习类别性能的同时,学习新类别,即使在不相交的领域之间也适用。
  • 将该策略扩展至具有多个增量的有界持续学习场景。
  • 在具有挑战性的条件下验证其有效性,包括跨领域增量和新型标签空间。

提出的方法

  • 引入‘幻象采样’——一种利用训练好的生成模型(GAN)为过去类别生成合成数据的技术。
  • 使用知识蒸馏为合成样本生成软标签,确保正确类别分布得以保留。
  • 在真实新数据与带有蒸馏目标的合成幻象数据组合上训练增量分类器。
  • 保留基础网络的副本用于幻象标签生成,确保不访问原始训练数据。
  • 通过为每个先前增量维护一个 GAN 和幻象采样器,将该方法扩展至有界持续学习。
  • 提出一种可扩展的终身学习路径,通过适应单一 GAN 来处理所有过去分布,尽管该方法仍处于探索阶段。

实验结果

研究问题

  • RQ1在不访问过去数据或重新训练的情况下,能否有效缓解增量学习中的灾难性遗忘?
  • RQ2在严格的数据隔离和领域无关性约束下,模型如何在保持先前学习类别高准确率的同时学习新类别?
  • RQ3幻象采样能否在不相交领域之间泛化,例如从 MNIST 到 SVHN?
  • RQ4该方法在有界持续学习中多个增量场景下的可扩展性如何?
  • RQ5该策略扩展至无界持续(终身)学习的潜力如何?

主要发现

  • 所提出的幻象采样策略显著减少了灾难性遗忘,使模型在不访问过去数据的情况下仍能对新类别保持强劲性能。
  • 在 MNIST 到 SVHN 的跨领域增量设置中,该方法相比基线方法性能提升了 20%。
  • 在 MNIST 和 SVHN 上进行三次增量的有界持续学习中,模型在所有类别上均保持了高准确率,早期增量的混淆极小。
  • 该方法在新型标签空间上的学习中表现出鲁棒性,显示出超越原始标签分布的泛化能力。
  • 即使在多次增量后,该策略在持续学习场景中仍实现了接近最先进水平的准确率。
  • 通过使用单一、持续更新的 GAN,该策略在原则上可扩展至终身学习,尽管这仍是未来工作的开放方向。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。