Skip to main content
QUICK REVIEW

[논문 리뷰] Sample Selection with Uncertainty of Losses for Learning with Noisy Labels

Xiaobo Xia, Tongliang Liu|arXiv (Cornell University)|2021. 06. 01.
Machine Learning and Data Classification참고 문헌 69인용 수 48
한 줄 요약

이 논문은 손실의 구간 기반 불확실성을 활용해 노이즈 라벨로 로버스트하게 학습하는 샘플 선택 방법 CNLCU를 도입하여, 균형/불균형 데이터 및 실제 노이즈에서의 로버스트함을 향상시킵니다.

ABSTRACT

In learning with noisy labels, the sample selection approach is very popular, which regards small-loss data as correctly labeled during training. However, losses are generated on-the-fly based on the model being trained with noisy labels, and thus large-loss data are likely but not certainly to be incorrect. There are actually two possibilities of a large-loss data point: (a) it is mislabeled, and then its loss decreases slower than other data, since deep neural networks "learn patterns first"; (b) it belongs to an underrepresented group of data and has not been selected yet. In this paper, we incorporate the uncertainty of losses by adopting interval estimation instead of point estimation of losses, where lower bounds of the confidence intervals of losses derived from distribution-free concentration inequalities, but not losses themselves, are used for sample selection. In this way, we also give large-loss but less selected data a try; then, we can better distinguish between the cases (a) and (b) by seeing if the losses effectively decrease with the uncertainty after the try. As a result, we can better explore underrepresented data that are correctly labeled but seem to be mislabeled at first glance. Experiments demonstrate that the proposed method is superior to baselines and robust to a broad range of label noise types.

연구 동기 및 목표

  • 레이블 노이즈 하에서 작은 손실 선택이 신뢰할 수 없을 수 있다는 점을 주목하여 로버스트 학습을 위한 동기 부여.
  • 점 손실이 아닌 구간 추정치를 사용하여 손실 불확실성을 통합합니다.
  • 시간에 따라 축적되는 손실을 대상으로 로버스트 평균 추정기(소프트 트렁케이션 및 하드 트렁케이션)를 개발하여 손실을 축적합니다.
  • 일부 샘플링이 덜 되었지만 잠재적으로 올바르게 라벨링된 데이터의 일반화 능력을 향상시키도록 권장합니다.
  • 합성된 균형/불균형 및 실제 노이즈 데이터셋 전반에 걸쳐 효과를 보여줍니다.

제안 방법

  • 모델 학습 손실을 반복(iteration) 간에 시간에 따라 진화하는(Markov) 프로세스로 모델링합니다.
  • 소요 간격을 확장하고 여러 이터레이션에 걸쳐 손실을 축적해 선택을 안정화합니다.
  • 로그 기반 영향 함수가 있는 로버스트 평균 추정기를 사용한 소프트 트렁케이션을 도입합니다.
  • KNN 기반 이상치 제거를 이용한 하드 트렁케이션으로 로버스트 평균 추정을 도입합니다.
  • 소프트 및 하드 추정기에 대한 집중(bound)을 도출해 보수적인 선택 기준을 얻습니다.
  • 두 네트워크의 동시 학습 프레임워크를 사용하여 각 네트워크가 자신의 피어를 학습시키기 위한 예시의 하위 집합을 선택합니다(Algorithm 1 CNLCU).

실험 결과

연구 질문

  • RQ1손실 불확실성을 활용해 노이즈 라벨 하에서 샘플 선택을 개선할 수 있는가?
  • RQ2로버스트 평균 추정기와 보수적 경계가 다양한 노이즈 유형과 클래스 불균형에 대한 강건성을 향상시키는가?
  • RQ3CNLCU가 합성 및 실제 노이즈 데이터셋에서 기존의 샘플 선택 방법과 어떻게 비교되는가?
  • RQ4큰 손실이지만 충분히 선택되지 못한 데이터에서 보완하여 보정된 깨끗한 예제를 회복하는 것이 유익한가?
  • RQ5소프트 및 하드 트렁케이션 전략은 다양한 학습 간격과 노이즈 체계에서 어떻게 성능이 다른가?

주요 결과

  • CNLCU-S 및 CNLCU-H는 여러 유형의 노이즈 및 수준에서 MNIST, F-MNIST, CIFAR 데이터셋에 대해 우수하거나 경쟁력 있는 정확도를 달성합니다.
  • 제안된 방법은 불균형한 노이즈 데이터 및 광범위한 노이즈 유형에 대한 강건성을 보이며 주요 설정에서 여러 베이스라인을 능가합니다.
  • 소프트 및 하드 트렁케이션은 로버스트 평균 추정 및 이상치 제거를 통해 손실 기반 샘플 선택의 안정성을 향상시킵니다.
  • CNLCU는 불균형한 합성 데이터셋에서 눈에 띄는 이득을 주며 미대표 클래스를 더 잘 활용함을 시사합니다.
  • Clothing1M에 대한 실험에서 CNLCU 변형이 Best 및 Last 메트릭에서 JoCor를 능가하나, 항상 최상위 백본에 도달하는 것은 아닙니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.