QUICK REVIEW

[論文レビュー] Prototype Reminding for Continual Learning.

Mengmi Zhang, Tao Wang|arXiv (Cornell University)|May 23, 2019

Domain Adaptation and Few-Shot Learning参考文献 23被引用数 11

ひとこと要約

本稿では、変分的プロトタイプ（平均と分散でパラメータ化されたもの）を用いてクラス固有の知識を表現し、深刻な忘却を軽減する、少サンプル連続的学習手法であるVariational Prototype Replaysを提案する。1つのクラスあたり1つのサンプルと、以前のタスクからのクラス代表的プロトタイプを格納することで、新しいタスクの学習中に過去の知識を効率的に再考可能であり、初期のタスクにおける性能劣化を回避する。

ABSTRACT

Continual learning refers to the ability to acquire and transfer knowledge without catastrophically forgetting what was previously learned. In this work, we consider \emph{few-shot} continual learning in classification tasks, and we propose a novel method, Variational Prototype Replays, that efficiently consolidates and recalls previous knowledge to avoid catastrophic forgetting. In each classification task, our method learns a set of variational prototypes with their means and variances, where embedding of the samples from the same class can be represented in a prototypical distribution and class-representative prototypes are separated apart. To alleviate catastrophic forgetting, our method replays one sample per class from previous tasks, and correspondingly matches newly predicted embeddings to their nearest class-representative prototypes stored from previous tasks. Compared with recent continual learning approaches, our method can readily adapt to new tasks with more classes without requiring the addition of new units. Furthermore, our method is more memory efficient since only class-representative prototypes with their means and variances, as well as only one sample per class from previous tasks need to be stored. Without tampering with the performance on initial tasks, our method learns novel concepts given a few training examples of each class in new tasks.

研究の動機と目的

1つのクラスあたり少数の例しか与えられない少サンプル連続的学習の文脈において、深刻な忘却を解消すること。
完全なデータセットを格納するか、モデル容量を拡張する必要がない、メモリ効率の良い手法を開発すること。
1つのクラスあたり1つのサンプルとクラス代表的プロトタイプのみを用いて、過去のタスクから新しいタスクへの有効な知識移転を可能にすること。
少数の例で新しい概念を学習しながらも、初期タスクにおける高い性能を維持すること。
アーキテクチャの拡張や新しいユニットの追加を必要としない、スケーラブルな連続的学習の解決策を提供すること。

提案手法

各クラスに対して、平均と分散でパラメータ化された変分的プロトタイプを学習し、クラス固有の埋め込み分布を表現する。
過去のタスクからの1クラスあたり1つのサンプルと、それに対応するクラス代表的プロトタイプを格納する。
新しいタスクにおける推論時、新たに予測された埋め込みを過去のタスクからの最も近いプロトタイプにマッチングする。
プロトタイプマッチングを用いて過去の知識を再考することで、古いデータの再学習なしに忘却を軽減する。
新しい埋め込みを事前に学習済みの分離済みプロトタイプに一致させることで、深刻な忘却を回避する。
新しいクラスが導入された際に、アーキテクチャの変更や新しいユニットの追加を必要としない。

実験結果

リサーチクエスチョン

RQ1アーキテクチャの拡張を伴わずに、メモリ効率の良い手法が少サンプル連続的学習における深刻な忘却を軽減できるか。
RQ2プロトタイプベースの知識再考は、新しいタスクの学習中に過去のタスクの性能をどの程度効果的に維持できるか。
RQ3過去のタスクから1つのサンプルずつ格納する場合、モデルの一般化能力と正確性をどの程度維持できるか。
RQ4学習された平均と分散を備えた変分的プロトタイプは、標準的な埋め込み平均化よりもクラス分布をより良く表現できるか。
RQ5増加するクラス数を伴う連続的タスクストリームに対して、この手法はどの程度スケーラブルか。

主な発見

本手法は、1つのクラスあたり少数の例しか与えられない新しいクラスを学習する中で、以前に学習したタスクにおける高い性能を維持する。
1つのクラスあたり1つのサンプルとクラス代表的プロトタイプのみを用いることで、知識統合を効果的に行い、メモリ使用量を顕著に削減する。
追加のモデルパラメータやアーキテクチャの変更を必要とせず、深刻な忘却を回避する。
プロトタイプマッチングにより、過去の知識の正確な再考が可能となり、新しいタスクにおける一般化性能が向上する。
より多くのクラスを含む新しいタスクに対しても、効果的にスケーリングされ、初期のタスクにおける性能劣化がない。
変分的プロトタイプの使用により、クラス分布の堅牢な表現が可能となり、一般化性能と安定性が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。