Skip to main content
QUICK REVIEW

[논문 리뷰] ReMixMatch: Semi-Supervised Learning with Distribution Matching and Augmentation Anchoring

David Berthelot, Nicholas Carlini|arXiv (Cornell University)|2020. 04. 30.
Domain Adaptation and Few-Shot Learning참고 문헌 26인용 수 338
한 줄 요약

ReMixMatch는 분포 보정과 증강 고정을 도입하여 비정규화된 예측을 진정된 레이블 분포와 일치시키고, 강한 증강과 약한 증강 간의 일관성을 유도함으로써 준지도 학습을 향상시킨다. 이 방법은 레이블이 훨씬 적은 경우에도 최고 성능을 기록하며, CIFAR-10에서 레이블이 250개 뿐인 경우 93.73%의 정확도를 달성하여 MixMatch가 4,000개의 레이블이 필요로 하는 93.58%를 뛰어넘는다.

ABSTRACT

We improve the recently-proposed ``MixMatch semi-supervised learning algorithm by introducing two new techniques: distribution alignment and augmentation anchoring. - Distribution alignment encourages the marginal distribution of predictions on unlabeled data to be close to the marginal distribution of ground-truth labels. - Augmentation anchoring} feeds multiple strongly augmented versions of an input into the model and encourages each output to be close to the prediction for a weakly-augmented version of the same input. To produce strong augmentations, we propose a variant of AutoAugment which learns the augmentation policy while the model is being trained. Our new algorithm, dubbed ReMixMatch, is significantly more data-efficient than prior work, requiring between 5 times and 16 times less data to reach the same accuracy. For example, on CIFAR-10 with 250 labeled examples we reach 93.73% accuracy (compared to MixMatch's accuracy of 93.58% with 4000 examples) and a median accuracy of 84.92% with just four labels per class.

연구 동기 및 목표

  • 대량의 레이블 데이터에 의존하는 것을 줄임으로써 준지도 학습의 데이터 효율성을 향상시키는 것.
  • 비정규화된 데이터 예측의 분포 이탈 문제를 해결하기 위해 모델 예측을 진정된 레이블 분포와 일치시키는 것.
  • 동일 입력의 약한 증강과 강한 증강 간의 일관성을 강제하여 모델의 강건성을 향상시키는 것.
  • 학습 중에 최적의 증강 정책을 학습하는 방법을 개발하여 일반화 성능을 향상시키는 것.

제안 방법

  • 분포 보정은 비정규화된 데이터에 대한 모델 예측의 주변 분포와 진정된 레이블 분포 간의 발산을 최소화한다.
  • 증강 고정은 각 입력에 대해 다수의 강한 증강을 사용하고, 각 증강이 동일 입력의 약한 증강 버전과 유사하게 예측하도록 유도한다.
  • 모델와 함께 동시에 학습되는 AutoAugment의 변형을 사용하여 학습 중에 최적의 증강 정책을 학습한다.
  • 레이블이 있는 데이터에 대한 교차 엔트로피 손실과 비정규화된 데이터에 대한 약한 증강과 강한 증강 모두에 대한 일관성 정규화를 조합하여 모델을 학습한다.
  • 비정규화된 데이터에 대한 예측의 안정성과 향상성을 높이기 위해 엔트로피 최소화와 분포 보정을 활용한다.

실험 결과

연구 질문

  • RQ1진정된 레이블 분포와 모델 예측을 일치시키는 분포 보정이 준지도 학습에서 일반화 성능을 향상시키는가?
  • RQ2약한 증강과 강한 증강 간의 일관성을 강제하면 모델의 강건성과 정확도가 향상되는가?
  • RQ3학습 중에 증강 정책을 탐색하는 방법이 준지도 학습 환경에서 고정된 증강 정책보다 우수한가?
  • RQ4ReMixMatch는 정확도를 유지하거나 향상시키면서 얼마나 많은 레이블 데이터 요구량을 줄일 수 있는가?

주요 결과

  • ReMixMatch는 레이블이 250개 뿐인 CIFAR-10에서 93.73%의 정확도를 기록하였으며, 이는 MixMatch가 4,000개의 레이블이 필요로 하는 93.58%를 뛰어넘는 성과이다.
  • 클래스당 레이블이 4개 뿐인 경우에도 ReMixMatch는 CIFAR-10에서 중앙값 정확도 84.92%를 달성하여 매우 높은 데이터 효율성을 보였다.
  • 기존 최고 수준의 방법들과 비교해 레이블 데이터 요구량을 5배에서 16배까지 줄일 수 있었다.
  • 분포 보정은 비정규화된 예측의 일관성을 크게 향상시키고, 비정규화된 예측의 분포 이탈을 감소시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.