QUICK REVIEW

[논문 리뷰] CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Chen Wei, Kihyuk Sohn|arXiv (Cornell University)|2021. 02. 18.

Imbalanced Data Classification Techniques참고 문헌 45인용 수 33

한 줄 요약

CReST는 불균형한 반지도학습을 개선하기 위한 클래스 재균형 자기 학습 프레임워크(및 점진적 변형 CReST+)를 도입하여 소수 클래스의 가짜 레이블을 우선 추가하고 분포를 점진적으로 정렬함으로써 긴 꼬리 데이터셋에서 최첨단 SSL 기준선 대비 강력한 이득을 제공합니다.

ABSTRACT

Semi-supervised learning on class-imbalanced data, although a realistic problem, has been under studied. While existing semi-supervised learning (SSL) methods are known to perform poorly on minority classes, we find that they still generate high precision pseudo-labels on minority classes. By exploiting this property, in this work, we propose Class-Rebalancing Self-Training (CReST), a simple yet effective framework to improve existing SSL methods on class-imbalanced data. CReST iteratively retrains a baseline SSL model with a labeled set expanded by adding pseudo-labeled samples from an unlabeled set, where pseudo-labeled samples from minority classes are selected more frequently according to an estimated class distribution. We also propose a progressive distribution alignment to adaptively adjust the rebalancing strength dubbed CReST+. We show that CReST and CReST+ improve state-of-the-art SSL algorithms on various class-imbalanced datasets and consistently outperform other popular rebalancing methods. Code has been made available at https://github.com/google-research/crest.

연구 동기 및 목표

레이블링된 데이터와 비레이블링 데이터가 불균형한 분포를 공유하는 SSL의 아직 충분히 연구되지 않은 문제를 동기 부여하고 다룹니다.
불균형 데이터에서 기존 SSL 방법의 편향을 조사하고 소수 클래스에서 높은 정밀도지만 낮은 재현을 식별합니다.
레이블된 집합을 더 공격적으로 샘플링하여 소수 클래스의 가짜 라벨 샘플을 더 적극적으로 선택해 재균형화하는 자기 학습 프레임워크(CReST)를 제안합니다.
자기 학습 중 모델 편향을 대응하기 위해 예측을 점진적으로 정렬하는 분포 정렬(CReST+)로 확장합니다.
다양한 레이블 비율과 불균형 비율에서 CIFAR-LT 및 ImageNet127 벤치마크에서 소수 클래스 재현 및 전체 정확도 향상을 입증합니다.

제안 방법

SSL에서 소수 클래스의 가짜 라벨 정밀도가 낮은 재현에도 불구하고 높다는 것을 관찰합니다.
추정된 클래스 분포를 기반으로 소수 클래스에 편향된, 비레이블 데이터에서 선택적으로 샘플링된 가짜 라벨 데이터로 레이블 집합을 확장하며 기초 SSL 모델을 반복적으로 재학습합니다.
클래스 l에서 추가할 가짜 라벨 샘플의 수를 결정하기 위해 mu_l이 ((N_{L+1-l}/N_1))^alpha에 비례하도록 사용합니다(알파 > 0은 소수 클래스를 우대).
생애 주기별 가짜 라벨의 재배치를 제어하기 위해 온도 스케일링 t를 사용하는 점진적 분포 정렬(DA)을 도입합니다(CReST+).
후대 세대에서 재균형의 영향을 증가시키면서 정밀도와 재현의 균형을 맞추기 위해 세대 간에 점진적으로 t를 감소시킵니다.
CIFAR-LT와 ImageNet127에서 FixMatch와 MixMatch로 벤치마킹하여 기본선 및 이전 방법들보다 개선을 보입니다.

실험 결과

연구 질문

RQ1클래스 불균형 데이터에서 SSL 성능은 어떻게 저하되며 소수 클래스의 정밀도를 활용해 재현을 개선할 수 있는가?
RQ2클래스 재균형 자기 학습 루프가 불균형된 레이블/비레이블 데이터에서 SSL 방법의 재현 및 전체 정확도를 개선할 수 있는가?
RQ3점진적 분포 정렬(CReST+)이 세대에 걸쳐 가짜 라벨 품질을 더 향상시키고 모델 편향을 줄이는가?
RQ4다양한 레이블 비율에서 장 tail CIFAR(CIFAR10-LT, CIFAR100-LT)와 대규모 ImageNet127 데이터세트에서 제안된 방법들의 성능은 어떠한가?
RQ5CReST와 CReST+가 DARP와 일반 재균형 방법과 같은 최첨단 불균형 SSL 방법들을 능가하는가?

주요 결과

CReST는 평가된 불균형 및 레이블 분수 전반에서 대조군 SSL 방법들보다 일관되게 개선되며 CIFAR-LT 벤치마크에서 정확도 최대 11.8%의 이득을 달성합니다.
CReST+는 점진적 분포 정렬을 통해 성능을 더 향상시키며 여러 설정에서 CReST 대비 추가 이득을 달성합니다.
CIFAR-LT (gamma 최대 200) 및 10–30% 라벨 데이터에서 CReST/CReST+는 FixMatch 및 MixMatch 기본선과 여러 재균형 기본선을 능가합니다.
ImageNet127에서 10% 라벨 데이터일 때 CReST+는 기본선 대비 재현을 7.9% 향상시킵니다.
특성 제거 연구는 알파가 0이 아닌 경우(클래스 재균형 샘플링)가 이득에 결정적이며, CReST+의 점진적으로 스케줄된 온도 t가 정밀도와 재현의 균형을 효과적으로 맞춥니다.
로짓 보정(post-processing) LA와 결합한 CReST+가 추가 향상을 제공하여 일부 비교에서 최상의 결과를 얻습니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.