[论文解读] Memory Replay with Data Compression for Continual Learning
MRDC 使用有损数据压缩来扩展旧数据内存以实现持续学习,并通过行列式点过程(DPP)选择压缩质量以在质量与数量之间取得平衡,同时避免重复训练。
Continual learning needs to overcome catastrophic forgetting of the past. Memory replay of representative old training samples has been shown as an effective solution, and achieves the state-of-the-art (SOTA) performance. However, existing work is mainly built on a small memory buffer containing a few original data, which cannot fully characterize the old data distribution. In this work, we propose memory replay with data compression (MRDC) to reduce the storage cost of old training samples and thus increase their amount that can be stored in the memory buffer. Observing that the trade-off between the quality and quantity of compressed data is highly nontrivial for the efficacy of memory replay, we propose a novel method based on determinantal point processes (DPPs) to efficiently determine an appropriate compression quality for currently-arrived training samples. In this way, using a naive data compression algorithm with a properly selected quality can largely boost recent strong baselines by saving more compressed data in a limited storage space. We extensively validate this across several benchmarks of class-incremental learning and in a realistic scenario of object detection for autonomous driving.
研究动机与目标
- 将记忆回放作为缓解连续学习中灾难性遗忘的一种方法的动机。
- 通过提出数据压缩来扩展内存容量,从而解决存储原始数据的低效问题。
- 开发一种方法,使用行列式点过程(DPPs)在无需重复训练的情况下选择合适的压缩质量。
- 在现实存储约束下,在大规模图像与目标检测基准上展示有效性。
提出的方法
- 提出带数据压缩的记忆回放(MRDC),通过以可控质量 q 对数据进行压缩来存储更多的旧样本。
- 将压缩质量的选择建模为通过条件确定性点过程(DPPs)在压缩子集中进行采样的问题。
- 通过优化一个代理目标来放松难以处理的 MLE 目标,该代理最大化目标原始子集特征表示的似然性,并强制压缩特征体积与原始特征体积之间的一致性。
- 推导一个实用优化(式(5)),通过在允许的公差内使压缩后特征体积与原始特征体积之比接近 1 来选择 q,同时最大化保留的压缩样本数量。
- 使用 JPEG 作为一种简单、广泛可用的有损压缩器,并在类别增量和半监督对象检测任务上进行评估。
- 在固定存储预算下将 MRDC 与强基线记忆回放进行比较,并分析计算成本。
实验结果
研究问题
- RQ1数据压缩是否能在不牺牲性能的情况下增加记忆回放的有效内存缓冲区大小?
- RQ2如何在不重新训练的情况下高效地选择压缩质量以在存储示例的质量与数量之间取得平衡?
- RQ3在现实存储约束下,MRDC 是否能在大规模图像分类和对象检测基准上提升连续学习的性能?
主要发现
- 在相同存储预算下,使用压缩数据的记忆回放可以显著优于原始数据的回放。
- 基于 DPP 的方法可以在无需重复训练的情况下选择合适的 JPEG 质量,并达到网格搜索质量结果,通常节省超过 100 倍的计算。
- MRDC 在 ImageNet-sub/全量以及 CUB-200-2011 上对若干强基线(如 LUCIR、PODNet、DDE、AANets)有所提升。
- 在大规模自动驾驶数据(SODA10M)中,MRDC 在半监督对象检测指标上相对于微调和基线记忆回放有显著提升。
- MRDC 维持具有竞争力的计算成本,相比强基线仅需适度的额外计算就能带来收益。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。