Skip to main content
QUICK REVIEW

[논문 리뷰] Self-Supervised Training Enhances Online Continual Learning

Jhair Gallardo, Tyler L. Hayes|arXiv (Cornell University)|2021. 03. 25.
Domain Adaptation and Few-Shot Learning참고 문헌 72인용 수 23
한 줄 요약

이 논문은 ImageNet에서 온라인 지속 학습(OCL)에 대해 지도 학습 전훈을 자기지도 학습 전훈으로 대체할 것을 제안하며, 특히 SwAV에서 유도된 자기지도 학습 특징이 미리 학습된 데이터가 제한된 조건에서 새로운 클래스로의 일반화 성능이 더 뛰어나며, 기존 최고 성능(SOTA) 대비 상대적 14.95% 향상된 상위-1 정확도를 달성함을 입증함.

ABSTRACT

In continual learning, a system must incrementally learn from a non-stationary data stream without catastrophic forgetting. Recently, multiple methods have been devised for incrementally learning classes on large-scale image classification tasks, such as ImageNet. State-of-the-art continual learning methods use an initial supervised pre-training phase, in which the first 10% - 50% of the classes in a dataset are used to learn representations in an offline manner before continual learning of new classes begins. We hypothesize that self-supervised pre-training could yield features that generalize better than supervised learning, especially when the number of samples used for pre-training is small. We test this hypothesis using the self-supervised MoCo-V2, Barlow Twins, and SwAV algorithms. On ImageNet, we find that these methods outperform supervised pre-training considerably for online continual learning, and the gains are larger when fewer samples are available. Our findings are consistent across three online continual learning algorithms. Our best system achieves a 14.95% relative increase in top-1 accuracy on class incremental ImageNet over the prior state of the art for online continual learning.

연구 동기 및 목표

  • 자기지도 학습 전훈이 기존의 지도 학습 전훈 대비 온라인 지속 학습(OCL)에서 일반화 성능을 향상시키는지 조사하기.
  • 특히 전훈 데이터가 제한된 조건에서, 자기지도 학습 특징이 새로운 ImageNet 카테고리에서의 분류 능력(판별 능력)을 어떻게 평가할 것인지.
  • 자기지도 학습 특징이 다양한 OCL 알고리즘에서 성능 향상에 기여하는지, 특히 데이터 부족 전훈 환경에서 어떻게 작용하는지 확인하기.
  • 지도 학습 전훈을 자기지도 학습 방법으로 대체함으로써 ImageNet에서 온라인 지속 학습의 새로운 최고 성능(SoTA)을 확립하기.

제안 방법

  • ImageNet 클래스의 일부에서 세 가지 자기지도 학습 방법(MoCo-V2, Barlow Twins, SwAV)을 사용해 사전 훈련된 ResNet-18 특징 추출.
  • 전훈 중에 볼 수 없었던 ImageNet 클래스에서의 오프라인 선형 평가를 통해 특징 품질 평가 및 일반화 능력 측정.
  • 자기지도 학습 특징을 REMIND OCL 프레임워크에 통합하여, 특징는 고정하고 오직 유연한 레이어만 온라인으로 업데이트함.
  • 다양한 전훈 데이터 크기에서 자기지도 학습 대비 지도 학습 전훈을 사용한 세 가지 OCL 알고리즘 간 성능 비교.
  • 오프라인 및 온라인 환경 모두에서 주요 평가 지표로 표준 ImageNet 1000개 클래스의 상위-1 정확도 사용.
  • 다양한 분석 설정에서 일관된 성능을 보이며 일반화 성능 향상이 두드러진 점을 고려해 SwAV를 가장 강력한 베이스라인으로 선정함.

실험 결과

연구 질문

  • RQ1전훈 데이터가 제한된 조건에서, 자기지도 학습 전훈이 지도 학습 전훈보다 새로운 ImageNet 클래스로의 일반화 성능이 더 뛰어나게 되는가?
  • RQ2오프라인 선형 평가에서 자기지도 학습 특징과 지도 학습 특징의 판별 능력은 어떻게 비교되는가?
  • RQ3자기지도 학습 특징은 다양한 OCL 알고리즘에서 온라인 지속 학습 환경에서 성능 향상에 기여하는가?
  • RQ4전훈 데이터 크기가 OCL에서 자기지도 학습과 지도 학습 전훈 간 성능 격차에 어떤 영향을 미치는가?
  • RQ5자기지도 학습 전훈이 ImageNet에서 온라인 지속 학습의 새로운 최고 성능(SoTA)을 달성할 수 있는가?

주요 결과

  • MoCo-V2, Barlow Twins, SwAV를 사용한 자기지도 학습 전훈이 오프라인 선형 평가 및 ImageNet에서의 온라인 지속 학습 모두에서 지도 학습 전훈을 능가함.
  • 전훈에 사용된 클래스 수가 적을수록 자기지도 학습과 지도 학습 전훈 간 성능 격차가 커지며, 데이터 부족이 심할수록 성능 향상이 더 두드러짐.
  • SwAV 특징는 모든 설정에서 최고의 성능를 기록하였으며, 오프라인 및 온라인 평가 모두에서 지도 학습 특징를 일관되게 능가하거나 동등하게 유지함.
  • ImageNet 클래스의 10%만으로 전훈한 경우, 자기지도 학습 방법이 기존 SOTA 대비 온라인 지속 학습에서 상위-1 정확도를 14.95% 상대적으로 향상함.
  • 특히 데이터가 적은 환경에서 자기지도 학습 특징는 지도 학습 특징보다 더 우수한 일반화 성능를 보이며, 카테고리에 종속되지 않는 표현을 학습하기 때문임.
  • 세 가지 다른 온라인 지속 학습 알고리즘 모두에서 결과가 일관되게 나타나, 자기지도 학습 전훈이 일반적인 성능 향상 수단으로서의 강건성을 입증함.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.