[논문 리뷰] CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning
CReST는 불균형한 반지도학습을 개선하기 위한 클래스 재균형 자기 학습 프레임워크(및 점진적 변형 CReST+)를 도입하여 소수 클래스의 가짜 레이블을 우선 추가하고 분포를 점진적으로 정렬함으로써 긴 꼬리 데이터셋에서 최첨단 SSL 기준선 대비 강력한 이득을 제공합니다.
Semi-supervised learning on class-imbalanced data, although a realistic problem, has been under studied. While existing semi-supervised learning (SSL) methods are known to perform poorly on minority classes, we find that they still generate high precision pseudo-labels on minority classes. By exploiting this property, in this work, we propose Class-Rebalancing Self-Training (CReST), a simple yet effective framework to improve existing SSL methods on class-imbalanced data. CReST iteratively retrains a baseline SSL model with a labeled set expanded by adding pseudo-labeled samples from an unlabeled set, where pseudo-labeled samples from minority classes are selected more frequently according to an estimated class distribution. We also propose a progressive distribution alignment to adaptively adjust the rebalancing strength dubbed CReST+. We show that CReST and CReST+ improve state-of-the-art SSL algorithms on various class-imbalanced datasets and consistently outperform other popular rebalancing methods. Code has been made available at https://github.com/google-research/crest.
연구 동기 및 목표
- 레이블링된 데이터와 비레이블링 데이터가 불균형한 분포를 공유하는 SSL의 아직 충분히 연구되지 않은 문제를 동기 부여하고 다룹니다.
- 불균형 데이터에서 기존 SSL 방법의 편향을 조사하고 소수 클래스에서 높은 정밀도지만 낮은 재현을 식별합니다.
- 레이블된 집합을 더 공격적으로 샘플링하여 소수 클래스의 가짜 라벨 샘플을 더 적극적으로 선택해 재균형화하는 자기 학습 프레임워크(CReST)를 제안합니다.
- 자기 학습 중 모델 편향을 대응하기 위해 예측을 점진적으로 정렬하는 분포 정렬(CReST+)로 확장합니다.
- 다양한 레이블 비율과 불균형 비율에서 CIFAR-LT 및 ImageNet127 벤치마크에서 소수 클래스 재현 및 전체 정확도 향상을 입증합니다.
제안 방법
- SSL에서 소수 클래스의 가짜 라벨 정밀도가 낮은 재현에도 불구하고 높다는 것을 관찰합니다.
- 추정된 클래스 분포를 기반으로 소수 클래스에 편향된, 비레이블 데이터에서 선택적으로 샘플링된 가짜 라벨 데이터로 레이블 집합을 확장하며 기초 SSL 모델을 반복적으로 재학습합니다.
- 클래스 l에서 추가할 가짜 라벨 샘플의 수를 결정하기 위해 mu_l이 ((N_{L+1-l}/N_1))^alpha에 비례하도록 사용합니다(알파 > 0은 소수 클래스를 우대).
- 생애 주기별 가짜 라벨의 재배치를 제어하기 위해 온도 스케일링 t를 사용하는 점진적 분포 정렬(DA)을 도입합니다(CReST+).
- 후대 세대에서 재균형의 영향을 증가시키면서 정밀도와 재현의 균형을 맞추기 위해 세대 간에 점진적으로 t를 감소시킵니다.
- CIFAR-LT와 ImageNet127에서 FixMatch와 MixMatch로 벤치마킹하여 기본선 및 이전 방법들보다 개선을 보입니다.
실험 결과
연구 질문
- RQ1클래스 불균형 데이터에서 SSL 성능은 어떻게 저하되며 소수 클래스의 정밀도를 활용해 재현을 개선할 수 있는가?
- RQ2클래스 재균형 자기 학습 루프가 불균형된 레이블/비레이블 데이터에서 SSL 방법의 재현 및 전체 정확도를 개선할 수 있는가?
- RQ3점진적 분포 정렬(CReST+)이 세대에 걸쳐 가짜 라벨 품질을 더 향상시키고 모델 편향을 줄이는가?
- RQ4다양한 레이블 비율에서 장 tail CIFAR(CIFAR10-LT, CIFAR100-LT)와 대규모 ImageNet127 데이터세트에서 제안된 방법들의 성능은 어떠한가?
- RQ5CReST와 CReST+가 DARP와 일반 재균형 방법과 같은 최첨단 불균형 SSL 방법들을 능가하는가?
주요 결과
- CReST는 평가된 불균형 및 레이블 분수 전반에서 대조군 SSL 방법들보다 일관되게 개선되며 CIFAR-LT 벤치마크에서 정확도 최대 11.8%의 이득을 달성합니다.
- CReST+는 점진적 분포 정렬을 통해 성능을 더 향상시키며 여러 설정에서 CReST 대비 추가 이득을 달성합니다.
- CIFAR-LT (gamma 최대 200) 및 10–30% 라벨 데이터에서 CReST/CReST+는 FixMatch 및 MixMatch 기본선과 여러 재균형 기본선을 능가합니다.
- ImageNet127에서 10% 라벨 데이터일 때 CReST+는 기본선 대비 재현을 7.9% 향상시킵니다.
- 특성 제거 연구는 알파가 0이 아닌 경우(클래스 재균형 샘플링)가 이득에 결정적이며, CReST+의 점진적으로 스케줄된 온도 t가 정밀도와 재현의 균형을 효과적으로 맞춥니다.
- 로짓 보정(post-processing) LA와 결합한 CReST+가 추가 향상을 제공하여 일부 비교에서 최상의 결과를 얻습니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.