Skip to main content
QUICK REVIEW

[論文レビュー] Memory Replay with Data Compression for Continual Learning

Liyuan Wang, Xingxing Zhang|arXiv (Cornell University)|Feb 14, 2022
Domain Adaptation and Few-Shot Learning被引用数 39
ひとこと要約

MRDC は継続学習のための繰り返しトレーニングを必要とせず、品質と量をバランスさせるために決定的点過程(DPP)を用いて、古いデータメモリを拡張する損失を伴うデータ圧縮を利用します。

ABSTRACT

Continual learning needs to overcome catastrophic forgetting of the past. Memory replay of representative old training samples has been shown as an effective solution, and achieves the state-of-the-art (SOTA) performance. However, existing work is mainly built on a small memory buffer containing a few original data, which cannot fully characterize the old data distribution. In this work, we propose memory replay with data compression (MRDC) to reduce the storage cost of old training samples and thus increase their amount that can be stored in the memory buffer. Observing that the trade-off between the quality and quantity of compressed data is highly nontrivial for the efficacy of memory replay, we propose a novel method based on determinantal point processes (DPPs) to efficiently determine an appropriate compression quality for currently-arrived training samples. In this way, using a naive data compression algorithm with a properly selected quality can largely boost recent strong baselines by saving more compressed data in a limited storage space. We extensively validate this across several benchmarks of class-incremental learning and in a realistic scenario of object detection for autonomous driving.

研究の動機と目的

  • 継続学習における壊滅的忘却を緩和する手段としてのメモリリプレイを動機づける。
  • 元データを保存する非効率を解消するため、データ圧縮を提案してメモリ容量を拡張する。
  • 繰り返しのトレーニングを必要とせずに適切な圧縮品質を選択する方法を決定的点過程(DPP)で開発する。
  • 現実的なストレージ制約下での大規模画像・オブジェクト検出ベンチマークで効果を示す。

提案手法

  • 品質 q によるデータ圧縮を用いて古いサンプルをより多く保存するメモリリプレイ(MRDC)を提案する。
  • 条件付き決定的点過程(DPPs)を介した圧縮サブセット上のサンプリング問題として圧縮品質選択をモデル化する。
  • 元の特徴量体積と圧縮後の特徴量体積の整合性を保ちつつ、ターゲットの元サブセット特徴表現の尤度を最大化する代理 objective を最適化して、扱いにくい MLE 目的を緩和する。
  • 圧縮後と元の特徴量体積の比率を許容範囲内で1に近づけつつ、保持された圧縮サンプル数を最大化する等式 (Eq. 5) を導出して実用的な最適化を行う。
  • JPEG を単純で広く入手可能な損失圏ライザーとして用い、クラス継承と半教師ありオブジェクト検出タスクで評価する。
  • 固定ストレージ予算の下で MRDC を強力なメモリリプレイベースラインと比較し、計算コストを分析する。

実験結果

リサーチクエスチョン

  • RQ1データ圧縮はメモリリプレイのメモリバッファの実効サイズを、性能を犠牲にすることなく増加させることができるか。
  • RQ2再訓練を行わずに、保存された例の品質と量のバランスを取るための圧縮品質を効率的に選択するにはどうすればよいか。
  • RQ3現実的なストレージ制約の下で MRDC は大規模な画像分類およびオブジェクト検出ベンチマークで継続学習の性能を向上させるか。

主な発見

  • 圧縮データを用いたメモリリプレイは、同じストレージ予算で元データのリプレイを大幅に上回ることができる。
  • DPP ベースの手法は繰り返し訓練なしで適切な JPEG 品質を選択でき、グリッドサーチの品質結果に匹敵し、しばしば100倍以上の計算を節約する。
  • MRDC は ImageNet-sub/Full および CUB-200-2011 で、いくつかの強力なベースライン(例: LUCIR、PODNet、DDE、AANets)を改善する。
  • 大規模な自動運転データ(SODA10M)では、MRDC は微調整および基準メモリリプレイに対して半教師ありオブジェクト検出指標で顕著な利得をもたらす。
  • MRDC は競争力のある計算コストを維持し、強力なベースラインと比較してわずかな追加計算で利益を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。