QUICK REVIEW

[논문 리뷰] ReMixMatch: Semi-Supervised Learning with Distribution Alignment and Augmentation Anchoring

David Berthelot, Nicholas Carlini|arXiv (Cornell University)|2019. 11. 21.

Domain Adaptation and Few-Shot Learning인용 수 321

한 줄 요약

ReMixMatch는 분포 정렬(distribution alignment)과 증강 고정(augmentation anchoring)을 추가하여 MixMatch를 개선하고, 훨씬 적은 라벨 데이터로 최첨단 SSL 정확도를 달성하며 CTAugment를 사용한 강한 증강을 활용합니다.

ABSTRACT

We improve the recently-proposed "MixMatch" semi-supervised learning algorithm by introducing two new techniques: distribution alignment and augmentation anchoring. Distribution alignment encourages the marginal distribution of predictions on unlabeled data to be close to the marginal distribution of ground-truth labels. Augmentation anchoring feeds multiple strongly augmented versions of an input into the model and encourages each output to be close to the prediction for a weakly-augmented version of the same input. To produce strong augmentations, we propose a variant of AutoAugment which learns the augmentation policy while the model is being trained. Our new algorithm, dubbed ReMixMatch, is significantly more data-efficient than prior work, requiring between $5\ imes$ and $16\ imes$ less data to reach the same accuracy. For example, on CIFAR-10 with 250 labeled examples we reach $93.73\\%$ accuracy (compared to MixMatch's accuracy of $93.58\\%$ with $4{,}000$ examples) and a median accuracy of $84.92\\%$ with just four labels per class. We make our code and data open-source at https://github.com/google-research/remixmatch.

연구 동기 및 목표

Semi-supervised 학습에서 데이터 효율성을 향상시키기 위해 MixMatch의 개선을 제안한다.
라벨이 없는 예측 분포를 실제 레이블 분포와 일치시키기 위한 분포 정렬을 도입한다.
약한 증강 앵커를 이용해 강한 증강을 안정화하는 증강 고정을 제안한다.
레이블 프록시 없이 온라인으로 강한 증강 정책을 학습하는 CTAugment를 개발한다.
표준 SSL 벤치마크에서 최첨단 성능을 입증하고 각 구성 요소의 기여를 분석한다.

제안 방법

라벨이 없는 예측의 이동 평균을 유지하고 p(y)/p̃(y) 비율을 사용하여 추정치를 재가중해 분포 정렬을 통합한다.
MixMatch의 일관성 규제를 증강 고정으로 바꾸고 약하게 증강된 앵커를 사용하여 여러 강하게 증강된 뷰를 감독한다.
감독 프록시 작업을 피하는 제어 이론 기반의 온라인 증강 정책 학습기인 CTAugment를 도입한다.
라벨이 없는 예제당 다중 강한 증강(K)을 적용하고 추정된 라벨을 샤픈(예리하게)하거나 온도 조절한다.
강화된 라벨링 데이터와 증강된 데이터에 대해 MixUp를 사용하고, 추가적인 pre-mixup unlabeled 손실과 회전 기반 자기 감독을 도입한다.
Adam으로 학습하고 고정 학습률과 가중치 감소를 사용하며 최종 가중치를 위해 지수 이동 평균을 활용한다.

실험 결과

연구 질문

RQ1분포 정렬이 라벨 분포와 일치시키는 것을 통해 SSL의 성능을 향상시키는가?
RQ2증강 고정이 강한 증강을 안정화하고 MixMatch보다 성능을 개선하는가?
RQ3온라인 CTAugment 기반 증강 정책이 SSL에서 어떤 영향을 미치는가?
RQ4표준 벤치마크에서 라벨 데이터의 양이 달라질 때 ReMixMatch의 성능은 어떻게 다른가?
RQ5배치별 차원을 통해 각 구성 요소의 기여는 무엇인가?

주요 결과

ReMixMatch는 CIFAR-10과 SVHN에서 라벨 데이터 양에 관계없이 최첨단 정확도를 달성한다.
CIFAR-10에서 250 라벨일 때 ReMixMatch는 93.73% 정확도에 도달하여 4,000 라벨의 MixMatch 성능과 일치하지만 훨씬 적은 데이터 사용.
STL-10에서 K=1 및 더 높은 K 값에서 ReMixMatch는 MixMatch에 비해 에러율을 대폭 감소시킨다.
배치 제거 연구(ablation)에서 분포 정렬, pre-mixup unlabeled 손실, 그리고 더 높은 K가 성능에 긍정적 영향을 미치며, 회전 손실은 매우 낮은 라벨 regime에서 도움이 된다.
CIFAR-10과 SVHN 전반에 걸쳐 ReMixMatch는 MixMatch에 비해 최대 16배의 데이터 효율성을 보인다.
소수 샷 설정(예: CIFAR-10의 클래스당 4 라벨)에서 ReMixMatch는 경쟁력 있는 중앙값 정확도를 달성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.