Skip to main content
QUICK REVIEW

[논문 리뷰] Improving out-of-distribution generalization via multi-task self-supervised pretraining

Isabela Albuquerque, Nikhil Naik|arXiv (Cornell University)|2020. 03. 30.
Domain Adaptation and Few-Shot Learning참고 문헌 41인용 수 27
한 줄 요약

이 논문은 컴퓨터 비전에서 분포 외 일반화(OOD) 성능을 향상시키기 위해 새로운 사전과제(task)를 포함한 다중 과제 자기지도 학습(SSL)을 제안한다. 특히, 가보 필터 벙크 응답 예측을 새로운 사전과제로 도입하고, 기존의 회전 예측 및 대비 학습과 결합하여 성능을 향상시킨다. 이 방법은 특히 큰 분포 이동이 발생할 경우에도 지도 학습 전훈보다 뛰어난 도메인 일반화 성능을 보이며, 기존의 도메인 일반화 기법(예: 불변 위험 최소화, IRM)과 조합하여 성능을 추가로 향상시킬 수 있다.

ABSTRACT

Self-supervised feature representations have been shown to be useful for supervised classification, few-shot learning, and adversarial robustness. We show that features obtained using self-supervised learning are comparable to, or better than, supervised learning for domain generalization in computer vision. We introduce a new self-supervised pretext task of predicting responses to Gabor filter banks and demonstrate that multi-task learning of compatible pretext tasks improves domain generalization performance as compared to training individual tasks alone. Features learnt through self-supervision obtain better generalization to unseen domains when compared to their supervised counterpart when there is a larger domain shift between training and test distributions and even show better localization ability for objects of interest. Self-supervised feature representations can also be combined with other domain generalization methods to further boost performance.

연구 동기 및 목표

  • 학습 데이터 분포와 다를 경우 모델이 실패하는 분포 외 일반화(OOD) 문제를 해결하기 위해 컴퓨터 비전에서의 도메인 일반화 성능을 향상시키는 것.
  • 자기지도 학습 특징 표현이 도메인 일반화에 있어 지도 학습 전훈 성능을 따라하거나 초월할 수 있는지 조사하는 것.
  • 유사한 사전과제를 활용한 다중 과제 자기지도 학습이 도메인 이동에 대한 강건성 향상에 기여하는지 평가하는 것.
  • 자기지도 표현이 기존의 도메인 일반화 기법(예: 불변 위험 최소화, IRM)과 호환되어 OOD 성능을 추가로 향상시킬 수 있는지 탐색하는 것.

제안 방법

  • 저자들은 도메인 일반화에 유용한 질감 및 에지 정보를 캡처할 수 있는 가보 필터 벙크 응답 예측을 새로운 자기지도 사전과제로 도입한다.
  • 이 사전과제를 기존의 표준 SSL 사전과제(예: 회전 예측 및 대비 학습, MoCo 방식 등)와 결합하여 다중 과제 학습 설정을 구성한다.
  • 다중 과제 SSL 프레임워크는 여러 사전과제를 동시에 사용하여 레이블이 없는 데이터에서 공유된 특징 인코더를 훈련시키며, 이는 분리된, 도메인 불변 특징 표현 학습을 장려한다.
  • 모든 과제에 대해 단일 인코더 헤드를 사용하며, 모든 사전과제 목표에 대해 역전파를 통해 공유 특징을 동시에 업데이트한다.
  • 학습된 자기지도 특징 표현은 표준 경험 리스크 최소화(ERM)를 사용하여 피나이팅(fine-tuning)되거나, IRM과 결합되어 도메인 일반화에 활용된다.
  • 실험은 PACS 및 VLCS 벤치마크에서 수행되었으며, OOD 일반화 성능 측정을 위해 보류된 도메인에서 평가가 이루어졌다.

실험 결과

연구 질문

  • RQ1표준 벤치마크에서 지도 학습 전훈에 비해 다중 과제 자기지도 학습이 분포 외 일반화 성능을 향상시킬 수 있는가?
  • RQ2제안된 가보 필터 벙크 사전과제가 특히 큰 도메인 이동 상황에서 도메인 일반화에 기여하는가?
  • RQ3기존의 도메인 일반화 기법(예: IRM)과 효과적으로 조합될 수 있는 자기지도 표현은 분포 외 성능 향상에 기여하는가?
  • RQ4자기지도 특징 표현은 자원이 제한된 분포 외 도메인에서 피나이팅될 경우 지도 학습 특징 표현에 비해 성능이 뛰어나게 되는가?

주요 결과

  • PACS 벤치마크에서 다중 과제 사전과제(R+G+DC)를 사용한 자기지도 학습은 OOD 일반화 평균 정확도 65.86%를 기록했으며, ERM 기반 지도 학습 베이스라인(60.44%)을 능가했다.
  • VLCS 벤치마크에서 자기지도 특징는 IRM을 사용할 경우 평균 정확도 68.46%를 기록했으며, 지도 학습 전훈 기반 결과(67.76%)보다 일관되게 향상된 성능을 보였다.
  • PACS의 Sketch 도메인에서 자기지도 학습은 IRM을 사용해 62.66%의 정확도를 달성했으며, 지도 학습 베이스라인(46.50%)에 비해 뚜렷한 승리를 거두었다.
  • VLCS의 Caltech101 도메인에서 자기지도 특징는 IRM 기반으로 87.74%의 정확도를 기록했으며, 지도 학습 특징와 동일한 성능(87.74%)을 보였지만, 이 경우 개선 폭은 미미했다.
  • 자기지도 특징는 특히 ImageNet에서의 도메인 이동이 뚜렷한 Sketch 및 LabelMe 도메인에서 관심 있는 객체의 국소화 능력이 뛰어났다.
  • 다중 과제 SSL과 IRM의 조합은 모든 타겟 도메인에서 가장 높은 성능을 기록했으며, 자기지도 학습과 도메인 일반화 최적화 간 상호보완적 이점이 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.