Skip to main content
QUICK REVIEW

[논문 리뷰] DualNet: Continual Learning, Fast and Slow

Quang Pham, Liu Chenghao|arXiv (Cornell University)|2021. 10. 01.
Domain Adaptation and Few-Shot Learning참고 문헌 52인용 수 60
한 줄 요약

DualNet은 느린 자가감독 학습자와 빠른 학습자가 온라인으로 동기화되어 일반 표현 학습 및 새로 주어진 라벨 데이터에 대한 빠른 적응을 수행하는 두 시스템의 연속 학습 프레임워크를 제안합니다. CORE50 및 miniImageNet 벤치마크에서 최첨단 baselines보다 우수합니다.

ABSTRACT

According to Complementary Learning Systems (CLS) theory~\citep{mcclelland1995there} in neuroscience, humans do effective \emph{continual learning} through two complementary systems: a fast learning system centered on the hippocampus for rapid learning of the specifics and individual experiences, and a slow learning system located in the neocortex for the gradual acquisition of structured knowledge about the environment. Motivated by this theory, we propose a novel continual learning framework named "DualNet", which comprises a fast learning system for supervised learning of pattern-separated representation from specific tasks and a slow learning system for unsupervised representation learning of task-agnostic general representation via a Self-Supervised Learning (SSL) technique. The two fast and slow learning systems are complementary and work seamlessly in a holistic continual learning framework. Our extensive experiments on two challenging continual learning benchmarks of CORE50 and miniImageNet show that DualNet outperforms state-of-the-art continual learning methods by a large margin. We further conduct ablation studies of different SSL objectives to validate DualNet's efficacy, robustness, and scalability. Code will be made available upon acceptance.

연구 동기 및 목표

  • 빠른 작업 특정 학습과 느린 일반 표현 학습을 분리하여 보완 학습 시스템(CLS) 이론을 통해 지속적 학습을 동기부여한다.
  • 느리고 SSL 기반 모듈로 표현 학습을 감독 학습으로부터 분리하고, 빠르며 샘플별 적응 모듈을 사용한다.
  • 동기적으로 학습된 느린 학습자와 빠른 학습자가 복잡한 벤치마크에서 망각 감소, 전이, 전반적 정확도 향상에 기여함을 입증한다.
  • 다양한 SSL 목적 함수와 최적화 기법에 대한 DualNet의 강건성을 보이고, 제거 연구(ablations) 및 준지도 학습 설정을 분석한다.

제안 방법

  • 두 모델 구조: 기억 샘플에 대한 자가감독 손실로 일반 표현을 학습하는 느린 학습자 φ와, 라벨 데이터에 대해 이 표현을 샘플별 변환 메커니즘으로 적응시키는 빠른 학습자 θ.
  • 느린 학습자의 목적: 자가감독 손실을 채택; 본 논문은 불변성을 촉진하고 중복성을 줄이기 위해 BarLow Twins 스타일 손실을 구현한다.
  • 느린 학습자의 최적화는 continual learning에서 진화하는 메모리 분포를 고려하여 수렴을 향상시키는 Look-ahead SGD를 사용한다.
  • 빠른 학습자의 목적: 입력에 조건화된 샘플별 적응으로 적응된 특징을 생성하여 작업 식별자 없이도 새로운 라벨 샘플로 신속하게 학습할 수 있게 한다.
  • 경험 재생: 입력되는 라벨 데이터와 기억 샘플을 소프트 레이블 손실과 KL 발산으로 결합하여 학습의 안정화를 도모한다.
  • 학습은 동기화되어: 느린 SSL 목표가 백그라운드에서 실행되고 빠른 학습자는 새로운 라벨 데이터에 대해 업데이트하며, 두 구성 요소를 통한 역전파를 수행한다.

실험 결과

연구 질문

  • RQ1느린 SSL 기반 표현 학습을 분리하고 샘플별 빠른 적응 메커니즘을 결합하면 지속적 학습 성능이 최첨단 방법들보다 향상될 수 있는가?
  • RQ2온라인 연속 학습 설정에서 느린 학습자와 빠른 학습자의 동기식 학습이 지식 보존과 작업 간 전이를 견고하게 가능하게 하는가?
  • RQ3다양한 SSL 목표 함수와 최적화 전략에 따라 DualNet의 성능은 어떻게 달라지는가?
  • RQ4라벨 데이터가 드문 준지도 지속 학습에서 DualNet가 효과적인가?
  • RQ5감독 업데이트 사이의 SSL 반복 횟수를 다르게 하면 망각 및 전이에 어떤 영향을 주는가?

주요 결과

  • DualNet은 CORE50 및 Split miniImageNet 벤치마크에서 태스크 인식 여부에 관계없이 baselines( ER, DER++, CTN 포함)보다 우수하다.
  • SSL로 학습된 느린 학습자는 태스크에 의존하지 않는 견고한 표현을 제공하여 태스크 간 일반화를 돕는다.
  • 빠른 학습자의 샘플별 적응은 작업 식별자 없이도 새로운 지식을 빠르게 습득할 수 있게 한다.
  • 느린 학습자에 Look-ahead 최적화와 BarLow Twins SSL을 사용하면 강한 수렴과 성능 향상을 얻고, ablations는 선택된 SSL 목적의 효능을 확인한다.
  • 더 많은 SSL 업데이트를 감독 업데이트 사이에 수행할수록 망각 감소 및 전이 향상이 나타나 DualNet은 다양한 SSL 반복에서도 효과적이다.
  • 부분 라벨링이 있는 준지도 설정에서 DualNet은 느린 SSL 분기를 통해 비라벨 데이터를 활용하여 baselines를 넘어서는 성능 향상을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.