QUICK REVIEW

[논문 리뷰] Class-Imbalanced Semi-Supervised Learning

Minsung Hyun, Jisoo Jeong|arXiv (Cornell University)|2020. 02. 17.

Imbalanced Data Classification Techniques참고 문헌 42인용 수 37

한 줄 요약

태스크 CISSL(class-imbalanced semi-supervised learning)를 정의하고, Suppressed Consistency Loss (SCL)를 제안하여 라벨링 데이터 및 비라벨링 데이터가 모두 불균형일 때 SSL을 개선합니다. MT+SCL은 특히 심한 불균형과 제한된 라벨 데이터에서 표준 SSL 방법보다 종종 우수한 성능을 발휘합니다.

ABSTRACT

Semi-Supervised Learning (SSL) has achieved great success in overcoming the difficulties of labeling and making full use of unlabeled data. However, SSL has a limited assumption that the numbers of samples in different classes are balanced, and many SSL algorithms show lower performance for the datasets with the imbalanced class distribution. In this paper, we introduce a task of class-imbalanced semi-supervised learning (CISSL), which refers to semi-supervised learning with class-imbalanced data. In doing so, we consider class imbalance in both labeled and unlabeled sets. First, we analyze existing SSL methods in imbalanced environments and examine how the class imbalance affects SSL methods. Then we propose Suppressed Consistency Loss (SCL), a regularization method robust to class imbalance. Our method shows better performance than the conventional methods in the CISSL environment. In particular, the more severe the class imbalance and the smaller the size of the labeled data, the better our method performs.

연구 동기 및 목표

레이블링 데이터와 비레이블링 데이터 모두에 불균형이 존재하는 CISSL 설정을 동기부여하고 형식화한다.
CISSL 하에서 기존 SSL 방법의 동작을 분석하고 불균형으로 인해 발생하는 실패 모드를 식별한다.
CISSL에서 SSL을 정규화하기 위한 Suppressed Consistency Loss (SCL)를 도입하고 불균형 시나리오 전반에 걸친 견고성을 입증한다.
대상 탐지로 CISSL을 확장하고 기본 SSL 접근법 대비 이점을 보여준다.

제안 방법

CISSL 및 라벨링 데이터와 비라벨링 데이터의 균형 있는 분포와 불균형 분포를 반영하는 표준 실험 설정을 정의한다.
toy 데이터셋을 사용하여 CISSL 하에서 기존 SSL 방법들(Pi 모델, Mean Teacher)의 경계 동작을 이해한다.
SCL을 제안하는데, 이는 g(Nc) 형태의 지수함수를 통해 클래스 빈도에 반비례하여 SSL 일관성 손실을 가중한다.
다양한 비라벨링 불균형 유형에서 CIFAR-10 및 SVHN에 대한 MT+SCL의 경험적 개선을 입증한다.
SCL을 객체 탐지 작업(SSD300/CSD 프레임워크)에 확장하고 성능 향상을 보여준다.

실험 결과

연구 질문

RQ1레이블링 데이터와 비레이블링 데이터가 모두 클래스 불균형인 CISSL에서 표준 SSL 방법은 어떻게 동작하는가?
RQ2Mean Teacher가 일반적으로 Pi 모델보다 CISSL에서 더 견고한 이유는 무엇이며, 타깃 업데이트가 이 동작에 어떻게 영향을 미치는가?
RQ3Suppressed Consistency Loss를 도입하면 소수 클래스의 성능 저하를 완화하고 전체 CISSL 성능을 개선하는가?
RQ4SCL의 CISSL 이점이 객체 탐지와 같은 다른 작업에 확장되는가?

주요 결과

일관성 규제에 기반한 SSL 방법은 CISSL에서 소수 클래스에서 성능 저하를 보이고, Mean Teacher가 보수적인 EMA 타깃으로 인해 Pi 모델보다 더 견고하다.
Suppressed Consistency Loss (SCL)는 클래스 빈도에 반비례하여 일관성 손실의 가중치를 조정함으로써 소수 클래스의 경계 왜곡을 완화하고, 불균형한 비라벨링 데이터 하에서 CIFAR-10 및 SVHN의 성능을 개선한다.
MT+SCL은 다양한 CISSL 구성에서 지속적으로 최상 또는 거의 최상인 결과를 달성하며, 불균형 및 비라벨링 불균형이 증가할수록 이러한 이점이 두드러진다.
ablation에서 표준 클래스 불균형 학습 손실(IN, Focal, CB)이 CISSL에서 항상 CE를 능가하지 않는다는 점은 CISSL 특정 정규화의 필요성을 강조한다.
SCL을 객체 탐지(CSD 프레임워크)에 적용하면 기본 CSD 방법보다 추가 이점을 얻는다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.