Skip to main content
QUICK REVIEW

[논문 리뷰] Robust Long-Tailed Learning under Label Noise

Tong Wei, Jiang-Xin Shi|arXiv (Cornell University)|2021. 08. 26.
Machine Learning and Data Classification참고 문헌 41인용 수 24
한 줄 요약

논문은 레이블 노이즈가 있는 롱테일 분포에서의 학습을 위해 라벨 노이즈 탐지기와 소프트 포즈 레이블링을 활용한 로버스트 프레임워크 RoLT를 도입하여 특히 꼬리 클래스의 일반화 성능을 향상시킵니다.

ABSTRACT

Long-tailed learning has attracted much attention recently, with the goal of improving generalisation for tail classes. Most existing works use supervised learning without considering the prevailing noise in the training dataset. To move long-tailed learning towards more realistic scenarios, this work investigates the label noise problem under long-tailed label distribution. We first observe the negative impact of noisy labels on the performance of existing methods, revealing the intrinsic challenges of this problem. As the most commonly used approach to cope with noisy labels in previous literature, we then find that the small-loss trick fails under long-tailed label distribution. The reason is that deep neural networks cannot distinguish correctly-labeled and mislabeled examples on tail classes. To overcome this limitation, we establish a new prototypical noise detection method by designing a distance-based metric that is resistant to label noise. Based on the above findings, we propose a robust framework,~\algo, that realizes noise detection for long-tailed learning, followed by soft pseudo-labeling via both label smoothing and diverse label guessing. Moreover, our framework can naturally leverage semi-supervised learning algorithms to further improve the generalisation. Extensive experiments on benchmark and real-world datasets demonstrate the superiority of our methods over existing baselines. In particular, our method outperforms DivideMix by 3\% in test accuracy. Source code will be released soon.

연구 동기 및 목표

  • 레이블 노이즈가 있는 롱테일 학습의 필요성 및 현실적인 데이터 조건을 반영하기 위한 동기 부여.
  • 작은 손실 기반 노이즈 탐지가 롱테일 분포에서 실패하는지 보이고 기하학적 대안을 제시합니다.
  • 프로토타입 거리 탐지기를 이용해 노이즈 샘플을 탐지하고 부드러운 포즈 레이블링을 수행하는 RoLT를 개발합니다.
  • 깨끗한 데이터와 노이즈 샘플 부분집합을 활용해 일반화를 더욱 향상시키기 위해 준지도 학습 아이디어를 활용합니다.
  • 벤치마크 및 실제 데이터셋에서 기준 방법들에 비해 로LT의 강인성 및 우수성을 입증합니다.

제안 방법

  • 클래스의 기하를 포착하기 위해 임베딩의 정규화된 평균으로 각 클래스 프로토타입을 계산합니다.
  • 프로토타입에 대한 거리 분포를 두 성분의 가우시안 혼합으로 모델링하여 클래스 독립적으로 깨끗한 데이터와 노이즈 데이터를 구분합니다.
  • 탐지된 깨끗한 예제의 부분집합을 사용해 프로토타입을 다듬어 노이즈 탐지의 정확성을 높입니다.
  • NERM 및 NCM 분류기의 예측과 원래 라벨을 결합하고 라벨 스무딩 및 시간적 앙상블을 적용하여 노이즈 샘플에 대해 소프트 포즈 레이블을 생성합니다.
  • 깨끗한 데이터에 대한 손실과 소프트하게 라벨링된 노이즈 데이터에 대한 손실을 결합한 손실로 학습하여 RoLT 내에서 준지도 스타일의 학습을 가능하게 합니다.

실험 결과

연구 질문

  • RQ1클래스 독립적인 프로토타입 거리 탐지가 롱테일 클래스 분포에서 깨끗한 데이터와 노이즈 데이터를 강인하게 분리할 수 있는가?
  • RQ2ERM, NCM 예측 및 라벨 스무딩을 결합한 소프트 포즈 레이블링이 꼬리 데이터의 노이즈에서 학습을 향상시키는가?
  • RQ3RoLT가 벤치마크 및 실제 노이즈 데이터셋에서 표준 롱테일 방법 및 기존 노이즈 라벨 접근법과 어떻게 비교되는가?
  • RQ4 RoLT를 준지도 학습 기법으로 확장해 일반화를 더 향상시킬 수 있는가?

주요 결과

  • RoLT는 varying imbalance ratios 및 noise levels에서 CIFAR-10/100의 ERM 및 여러 롱테일 기준선들보다 현저히 높은 성능을 보입니다.
  • RoLT–DRW 및 RoLT+는 노이즈가 증가할수록 더 큰 이득을 얻으며, 노이즈 탐지의 효과와 강건한 학습을 강조합니다.
  • NCM 기반 예측은 ERM보다 꼬리 클래스 재현율이 더 균형 잡혀 있어 제안된 프로토타입 노이즈 탐지 전략을 지지합니다.
  • 라벨 스무딩 및 다양한 라벨 추측에 의한 소프트 레이블링은 노이즈 라벨이나 ERM 예측만 사용하는 경우보다 성능을 개선합니다.
  • WebVision에서 RoLT+는 노이즈 라벨 및 롱테일 방법 중 최첨단 접근법과 비교해 경쟁력 있는 top-1/top-5 정확도를 달성합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.