QUICK REVIEW

[논문 리뷰] Prototype Reminding for Continual Learning.

Mengmi Zhang, Tao Wang|arXiv (Cornell University)|2019. 05. 23.

Domain Adaptation and Few-Shot Learning참고 문헌 23인용 수 11

한 줄 요약

이 논문은 변동형 프로토타입을 사용하여 클래스별 지식을 표현하고 치명적인 잊음( catastrophic forgetting)을 줄이는 소수의 예시로 지속적 학습을 수행하는 방법인 Variational Prototype Replays를 제안한다. 각 클래스당 하나의 샘플과 이전 작업에서 유도된 클래스 기반 프로토타입을 저장함으로써, 새로운 작업 학습 시 이전 지식을 효율적으로 회상할 수 있으며, 이로 인해 이전 작업의 성능 저하 없이 학습이 가능하다.

ABSTRACT

Continual learning refers to the ability to acquire and transfer knowledge without catastrophically forgetting what was previously learned. In this work, we consider \emph{few-shot} continual learning in classification tasks, and we propose a novel method, Variational Prototype Replays, that efficiently consolidates and recalls previous knowledge to avoid catastrophic forgetting. In each classification task, our method learns a set of variational prototypes with their means and variances, where embedding of the samples from the same class can be represented in a prototypical distribution and class-representative prototypes are separated apart. To alleviate catastrophic forgetting, our method replays one sample per class from previous tasks, and correspondingly matches newly predicted embeddings to their nearest class-representative prototypes stored from previous tasks. Compared with recent continual learning approaches, our method can readily adapt to new tasks with more classes without requiring the addition of new units. Furthermore, our method is more memory efficient since only class-representative prototypes with their means and variances, as well as only one sample per class from previous tasks need to be stored. Without tampering with the performance on initial tasks, our method learns novel concepts given a few training examples of each class in new tasks.

연구 동기 및 목표

클래스당 소수의 예시만 제공되는 소수의 예시 지속적 학습 환경에서 치명적인 잊음을 해결하기 위해.
완전한 데이터셋을 저장하거나 모델 용량을 늘리지 않는 메모리 효율적인 방법을 개발하기 위해.
클래스당 하나의 샘플과 클래스 기반 프로토타입만을 사용하여 이전 작업에서의 지식을 효과적으로 새로운 작업으로 전이하기 위해.
소수의 예시로 새로운 개념을 학습하는 동안 초기 작업에서의 높은 성능를 유지하기 위해.
아키텍처 확장이나 새로운 클래스를 위한 추가 단위가 필요 없는 확장 가능한 지속적 학습 솔루션을 제공하기 위해.

제안 방법

각 클래스에 대해 평균과 분산으로 파arameterized된 변동형 프로토타입을 학습하여 클래스 기반 임bedding 분포를 표현한다.
이전 작업에서 각 클래스당 하나의 샘플과 해당 클래스의 대표 프로토타입만 저장한다.
새로운 작업에서 추론할 때, 새로운 예측된 임베딩을 이전 작업의 가장 가까운 프로토타입과 매칭한다.
이 방법은 프로토타입 매칭을 통해 이전 지식을 회상함으로써, 오래된 데이터를 재학습하지 않아도 잊음이 줄어든다.
새로운 임베딩을 이전에 학습된 분리된 프로토타입에 정렬시킴으로써 치명적인 잊음을 방지한다.
새로운 클래스가 도입될 때 아키텍처 변경이나 새로운 단위 추가가 필요 없다.

실험 결과

연구 질문

RQ1아키텍처 확장을 요구하지 않고 메모리 효율적인 방법이 소수의 예시 지속적 학습 환경에서 치명적인 잊음을 줄일 수 있는가?
RQ2프로토타입 기반의 지식 회상은 새로운 작업 학습 중에 이전 작업의 성능를 얼마나 효과적으로 유지하는가?
RQ3과거 작업에서 클래스당 하나의 샘플만 저장할 경우 모델의 일반화 능력과 정확도를 얼마나 잘 유지할 수 있는가?
RQ4학습된 평균과 분산을 가진 변동형 프로토타입이 표준 임베딩 평균화보다 클래스 분포를 더 잘 표현할 수 있는가?
RQ5점점 증가하는 수의 클래스를 가진 지속적 작업 스트림에 대해 이 방법은 어떻게 확장되는가?

주요 결과

클래스당 소수의 예시만으로도 새로운 클래스를 학습하면서 이전에 학습된 작업에서의 높은 성능를 유지한다.
클래스당 하나의 샘플과 클래스 기반 프로토타입만을 사용하여 효과적인 지식 통합을 달성하며, 메모리 사용을 크게 줄였다.
추가 모델 파rameter나 아키텍처 수정 없이 치명적인 잊음을 방지한다.
프로토타입 매칭을 통해 정확한 이전 지식 회상이 가능해져 새로운 작업에서의 일반화 능력이 향상된다.
더 많은 클래스를 포함하는 새로운 작업에 대해서도 효과적으로 스케일링되며, 이전 작업의 성능 저하 없이 작동한다.
변동형 프로토타입의 사용은 클래스 분포의 견고한 표현을 가능하게 하여 일반화 능력과 안정성을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.