QUICK REVIEW

[논문 리뷰] ReMixMatch: Semi-Supervised Learning with Distribution Matching and Augmentation Anchoring

David Berthelot, Nicholas Carlini|arXiv (Cornell University)|2020. 04. 30.

Domain Adaptation and Few-Shot Learning참고 문헌 26인용 수 338

한 줄 요약

ReMixMatch는 분포 보정과 증강 고정을 도입하여 비정규화된 예측을 진정된 레이블 분포와 일치시키고, 강한 증강과 약한 증강 간의 일관성을 유도함으로써 준지도 학습을 향상시킨다. 이 방법은 레이블이 훨씬 적은 경우에도 최고 성능을 기록하며, CIFAR-10에서 레이블이 250개 뿐인 경우 93.73%의 정확도를 달성하여 MixMatch가 4,000개의 레이블이 필요로 하는 93.58%를 뛰어넘는다.

ABSTRACT

We improve the recently-proposed ``MixMatch semi-supervised learning algorithm by introducing two new techniques: distribution alignment and augmentation anchoring. - Distribution alignment encourages the marginal distribution of predictions on unlabeled data to be close to the marginal distribution of ground-truth labels. - Augmentation anchoring} feeds multiple strongly augmented versions of an input into the model and encourages each output to be close to the prediction for a weakly-augmented version of the same input. To produce strong augmentations, we propose a variant of AutoAugment which learns the augmentation policy while the model is being trained. Our new algorithm, dubbed ReMixMatch, is significantly more data-efficient than prior work, requiring between 5 times and 16 times less data to reach the same accuracy. For example, on CIFAR-10 with 250 labeled examples we reach 93.73% accuracy (compared to MixMatch's accuracy of 93.58% with 4000 examples) and a median accuracy of 84.92% with just four labels per class.

연구 동기 및 목표

대량의 레이블 데이터에 의존하는 것을 줄임으로써 준지도 학습의 데이터 효율성을 향상시키는 것.
비정규화된 데이터 예측의 분포 이탈 문제를 해결하기 위해 모델 예측을 진정된 레이블 분포와 일치시키는 것.
동일 입력의 약한 증강과 강한 증강 간의 일관성을 강제하여 모델의 강건성을 향상시키는 것.
학습 중에 최적의 증강 정책을 학습하는 방법을 개발하여 일반화 성능을 향상시키는 것.

제안 방법

분포 보정은 비정규화된 데이터에 대한 모델 예측의 주변 분포와 진정된 레이블 분포 간의 발산을 최소화한다.
증강 고정은 각 입력에 대해 다수의 강한 증강을 사용하고, 각 증강이 동일 입력의 약한 증강 버전과 유사하게 예측하도록 유도한다.
모델와 함께 동시에 학습되는 AutoAugment의 변형을 사용하여 학습 중에 최적의 증강 정책을 학습한다.
레이블이 있는 데이터에 대한 교차 엔트로피 손실과 비정규화된 데이터에 대한 약한 증강과 강한 증강 모두에 대한 일관성 정규화를 조합하여 모델을 학습한다.
비정규화된 데이터에 대한 예측의 안정성과 향상성을 높이기 위해 엔트로피 최소화와 분포 보정을 활용한다.

실험 결과

연구 질문

RQ1진정된 레이블 분포와 모델 예측을 일치시키는 분포 보정이 준지도 학습에서 일반화 성능을 향상시키는가?
RQ2약한 증강과 강한 증강 간의 일관성을 강제하면 모델의 강건성과 정확도가 향상되는가?
RQ3학습 중에 증강 정책을 탐색하는 방법이 준지도 학습 환경에서 고정된 증강 정책보다 우수한가?
RQ4ReMixMatch는 정확도를 유지하거나 향상시키면서 얼마나 많은 레이블 데이터 요구량을 줄일 수 있는가?

주요 결과

ReMixMatch는 레이블이 250개 뿐인 CIFAR-10에서 93.73%의 정확도를 기록하였으며, 이는 MixMatch가 4,000개의 레이블이 필요로 하는 93.58%를 뛰어넘는 성과이다.
클래스당 레이블이 4개 뿐인 경우에도 ReMixMatch는 CIFAR-10에서 중앙값 정확도 84.92%를 달성하여 매우 높은 데이터 효율성을 보였다.
기존 최고 수준의 방법들과 비교해 레이블 데이터 요구량을 5배에서 16배까지 줄일 수 있었다.
분포 보정은 비정규화된 예측의 일관성을 크게 향상시키고, 비정규화된 예측의 분포 이탈을 감소시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.