Skip to main content
QUICK REVIEW

[논문 리뷰] CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Chen Wei, Kihyuk Sohn|arXiv (Cornell University)|2021. 02. 18.
Imbalanced Data Classification Techniques참고 문헌 45인용 수 33
한 줄 요약

CReST는 불균형한 반지도학습을 개선하기 위한 클래스 재균형 자기 학습 프레임워크(및 점진적 변형 CReST+)를 도입하여 소수 클래스의 가짜 레이블을 우선 추가하고 분포를 점진적으로 정렬함으로써 긴 꼬리 데이터셋에서 최첨단 SSL 기준선 대비 강력한 이득을 제공합니다.

ABSTRACT

Semi-supervised learning on class-imbalanced data, although a realistic problem, has been under studied. While existing semi-supervised learning (SSL) methods are known to perform poorly on minority classes, we find that they still generate high precision pseudo-labels on minority classes. By exploiting this property, in this work, we propose Class-Rebalancing Self-Training (CReST), a simple yet effective framework to improve existing SSL methods on class-imbalanced data. CReST iteratively retrains a baseline SSL model with a labeled set expanded by adding pseudo-labeled samples from an unlabeled set, where pseudo-labeled samples from minority classes are selected more frequently according to an estimated class distribution. We also propose a progressive distribution alignment to adaptively adjust the rebalancing strength dubbed CReST+. We show that CReST and CReST+ improve state-of-the-art SSL algorithms on various class-imbalanced datasets and consistently outperform other popular rebalancing methods. Code has been made available at https://github.com/google-research/crest.

연구 동기 및 목표

  • 레이블링된 데이터와 비레이블링 데이터가 불균형한 분포를 공유하는 SSL의 아직 충분히 연구되지 않은 문제를 동기 부여하고 다룹니다.
  • 불균형 데이터에서 기존 SSL 방법의 편향을 조사하고 소수 클래스에서 높은 정밀도지만 낮은 재현을 식별합니다.
  • 레이블된 집합을 더 공격적으로 샘플링하여 소수 클래스의 가짜 라벨 샘플을 더 적극적으로 선택해 재균형화하는 자기 학습 프레임워크(CReST)를 제안합니다.
  • 자기 학습 중 모델 편향을 대응하기 위해 예측을 점진적으로 정렬하는 분포 정렬(CReST+)로 확장합니다.
  • 다양한 레이블 비율과 불균형 비율에서 CIFAR-LT 및 ImageNet127 벤치마크에서 소수 클래스 재현 및 전체 정확도 향상을 입증합니다.

제안 방법

  • SSL에서 소수 클래스의 가짜 라벨 정밀도가 낮은 재현에도 불구하고 높다는 것을 관찰합니다.
  • 추정된 클래스 분포를 기반으로 소수 클래스에 편향된, 비레이블 데이터에서 선택적으로 샘플링된 가짜 라벨 데이터로 레이블 집합을 확장하며 기초 SSL 모델을 반복적으로 재학습합니다.
  • 클래스 l에서 추가할 가짜 라벨 샘플의 수를 결정하기 위해 mu_l이 ((N_{L+1-l}/N_1))^alpha에 비례하도록 사용합니다(알파 > 0은 소수 클래스를 우대).
  • 생애 주기별 가짜 라벨의 재배치를 제어하기 위해 온도 스케일링 t를 사용하는 점진적 분포 정렬(DA)을 도입합니다(CReST+).
  • 후대 세대에서 재균형의 영향을 증가시키면서 정밀도와 재현의 균형을 맞추기 위해 세대 간에 점진적으로 t를 감소시킵니다.
  • CIFAR-LT와 ImageNet127에서 FixMatch와 MixMatch로 벤치마킹하여 기본선 및 이전 방법들보다 개선을 보입니다.

실험 결과

연구 질문

  • RQ1클래스 불균형 데이터에서 SSL 성능은 어떻게 저하되며 소수 클래스의 정밀도를 활용해 재현을 개선할 수 있는가?
  • RQ2클래스 재균형 자기 학습 루프가 불균형된 레이블/비레이블 데이터에서 SSL 방법의 재현 및 전체 정확도를 개선할 수 있는가?
  • RQ3점진적 분포 정렬(CReST+)이 세대에 걸쳐 가짜 라벨 품질을 더 향상시키고 모델 편향을 줄이는가?
  • RQ4다양한 레이블 비율에서 장 tail CIFAR(CIFAR10-LT, CIFAR100-LT)와 대규모 ImageNet127 데이터세트에서 제안된 방법들의 성능은 어떠한가?
  • RQ5CReST와 CReST+가 DARP와 일반 재균형 방법과 같은 최첨단 불균형 SSL 방법들을 능가하는가?

주요 결과

  • CReST는 평가된 불균형 및 레이블 분수 전반에서 대조군 SSL 방법들보다 일관되게 개선되며 CIFAR-LT 벤치마크에서 정확도 최대 11.8%의 이득을 달성합니다.
  • CReST+는 점진적 분포 정렬을 통해 성능을 더 향상시키며 여러 설정에서 CReST 대비 추가 이득을 달성합니다.
  • CIFAR-LT (gamma 최대 200) 및 10–30% 라벨 데이터에서 CReST/CReST+는 FixMatch 및 MixMatch 기본선과 여러 재균형 기본선을 능가합니다.
  • ImageNet127에서 10% 라벨 데이터일 때 CReST+는 기본선 대비 재현을 7.9% 향상시킵니다.
  • 특성 제거 연구는 알파가 0이 아닌 경우(클래스 재균형 샘플링)가 이득에 결정적이며, CReST+의 점진적으로 스케줄된 온도 t가 정밀도와 재현의 균형을 효과적으로 맞춥니다.
  • 로짓 보정(post-processing) LA와 결합한 CReST+가 추가 향상을 제공하여 일부 비교에서 최상의 결과를 얻습니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.