Skip to main content
QUICK REVIEW

[論文レビュー] Subspace Regularizers for Few-Shot Class Incremental Learning

Afra Feyza Akyürek, Ekin Akyürek|arXiv (Cornell University)|Oct 13, 2021
Domain Adaptation and Few-Shot Learning参考文献 44被引用数 42
ひとこと要約

この論文は、新しいクラスの重みに対する単純な部分空間正則化を、意味情報を任意に増強することで、事前学習特徴抽出器と組み合わせた場合、素のロジスティック回帰がFew-shotクラスインクリメンタルラーニングで最先端の成果を達成できることを示している。

ABSTRACT

Few-shot class incremental learning -- the problem of updating a trained classifier to discriminate among an expanded set of classes with limited labeled data -- is a key challenge for machine learning systems deployed in non-stationary environments. Existing approaches to the problem rely on complex model architectures and training procedures that are difficult to tune and re-use. In this paper, we present an extremely simple approach that enables the use of ordinary logistic regression classifiers for few-shot incremental learning. The key to this approach is a new family of subspace regularization schemes that encourage weight vectors for new classes to lie close to the subspace spanned by the weights of existing classes. When combined with pretrained convolutional feature extractors, logistic regression models trained with subspace regularization outperform specialized, state-of-the-art approaches to few-shot incremental image classification by up to 22% on the miniImageNet dataset. Because of its simplicity, subspace regularization can be straightforwardly extended to incorporate additional background information about the new classes (including class names and descriptions specified in natural language); these further improve accuracy by up to 2%. Our results show that simple geometric regularization of class representations offers an effective tool for continual learning.

研究の動機と目的

  • FSCILの課題に対処し、基底分類器を再訓練なしに少数のラベル付き例で新クラスへ拡張する。
  • 新しいクラスの重みを基底クラスの重みが張る部分空間に近づけて忘却と過学習を抑える正則化を提案する。
  • 意味情報を用いた意味的情報を取り入れ、言語埋め込みを用いて新しい重みを基底クラスの意味的組み合わせへ導く。
  • 標準アーキテクチャ(例:ResNet)および事前学習済み特徴と組み合わせて、複雑な FSCIL 専用モデルを回避しつつ方法が機能することを示す。

提案手法

  • 基底クラスで通常のクロスエントロピーと重み・特徴正則化を用いて特徴抽出器と分類器を学習する。
  • 増分セッション中は特徴抽出器を凍結し、新しいクラスの重みのみを正則化子で最適化する(a)新規重みを基底部分空間の近くに保つ、(b)任意で言語埋め込みから導かれた意味ターゲットへ引き寄せる。
  • 新規重みの基底重みで張られる部分空間からの射影として部分空間ターゲット m_c を計算し、距離 ||eta_c - m_c||^2 をペナルティ化する。
  • semantic subspace regularizationを拡張し、射影を言語埋め込みの類似度に応じて基底クラス重みの加重和で形成される意味ターゲット l_c に置き換える(温度 τ を用いる)。
  • 任意で、意味埋め込みから基底クラス重み空間への線形写像 L を学習し、novel weights を L(e_c) に向けて正則化する。
  • 標準的な SGD 最適化を使用し、マルチセッションの mini-ImageNet および 単一セッションの設定で忘却の軽減と精度向上を示す。

実験結果

リサーチクエスチョン

  • RQ1部分空間正則化は、基底クラス表現を安定させつつ、少数の例で新クラスを効果的に統合できるか。
  • RQ2言語埋め込みによる意味情報の導入は、純粋な部分空間正則化を超えて FSCIL の性能を向上させるか。
  • RQ3事前学習済み特徴と組み合わせた場合、素のロジスティック回帰で最先端の FSCIL 性能を達成できるか。

主な発見

  • 部分空間正則化は、複数の増分ステップに渡るマルチセッション mini-ImageNet において強力なベースラインを上回る精度を達成する。
  • 意味的部分空間正則化は、基底クラスと新規クラス間の言語由来の関係性を活用することで追加の利得を提供する。
  • 過去の exemplars の記憶を利用することで忘却をさらに低減し、正則化は引き続き有益である。
  • 専門的 FSCIL 手法と比較して、提案手法は標準アーキテクチャでいくつかの設定で競争力がある、あるいは優れている。
  • このアプローチは、単純な幾何学的正則化が FSCIL における忘却と過学習に対処する有効な手段となることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。