Skip to main content
QUICK REVIEW

[논문 리뷰] Confidence Scores Make Instance-dependent Label-noise Learning Possible

Antonin Berthon, Bo Han|arXiv (Cornell University)|2020. 01. 11.
Machine Learning and Data Classification참고 문헌 58인용 수 36
한 줄 요약

이 논문은 신뢰도 점수 기반의 인스턴스 의존적 노이즈(CSIDN)와 per-instance 신뢰도를 활용하여 클래스 전이 확률을 추정하는 인스턴스 수준의 forward correction(ILFC) 방법을 제시합니다. 이를 통해 인스턴스 의존 라벨 노이즈 하에서 강건한 학습이 가능하며 Synthetic 및 실데이터에서 베이스라인보다 우수한 성능을 보입니다.

ABSTRACT

In learning with noisy labels, for every instance, its label can randomly walk to other classes following a transition distribution which is named a noise model. Well-studied noise models are all instance-independent, namely, the transition depends only on the original label but not the instance itself, and thus they are less practical in the wild. Fortunately, methods based on instance-dependent noise have been studied, but most of them have to rely on strong assumptions on the noise models. To alleviate this issue, we introduce confidence-scored instance-dependent noise (CSIDN), where each instance-label pair is equipped with a confidence score. We find with the help of confidence scores, the transition distribution of each instance can be approximately estimated. Similarly to the powerful forward correction for instance-independent noise, we propose a novel instance-level forward correction for CSIDN. We demonstrate the utility and effectiveness of our method through multiple experiments under synthetic label noise and real-world unknown noise.

연구 동기 및 목표

  • 노이즈가 있는 라벨의 학습을 현실적이고 인스턴스 의존적인 설정에서 동기화시키는 것을 목표로 한다. 라벨 악화가 클래스와 특징 모두에 의존한다.
  • 각 인스턴스마다 신뢰도 점수로 노이즈 전이를 근사하고 IDN를 실현 가능하게 만든다.
  • CSIDN 모델과 실용적인 알고리즘(ILFC)을 제안하여 인스턴스별 전이와 강건한 분류기를 학습한다.
  • 합성 실험과 Clothing1M를 포함한 실세계 데이터셋을 통해 효과를 입증한다.

제안 방법

  • 각 인스턴스에 대해 신뢰도 점수 r_x = P(Y= bar{y} | bar{Y}= bar{y}, X=x)로 정의한다.
  • 라벨 노이즈 전이 행렬 T(x)는 인스턴스 의존적이지만 대각 항 T_{i,i}(x)은 r_x와 밀도 비 β_i(x)를 이용해 추정할 수 있도록 CSIDN을 형성한다.
  • 비대각 항은 T_{i,j}(x) = α_{i,j} (1 - T_{i,i}(x))로 가정하며, α_{i,j}는 인스턴스 간에 상수로 두고 앵커 포인트(anchor points)를 통해 추정한다.
  • 노이즈가 섞인 데이터와 분류기 출력을 사용하여 β_i(x)와 T_{i,i}(x)를 반복적으로 추정하는 절차를 개발한다.
  • 인스턴스 수준의 forward-corrected 손실을 정의하고 ILFC 단계를 포함한 분류기 h를 학습한다(α와 T의 앵커 포인트 기반 추정 및 밀도 비 업데이트 포함).
  • 효과적인 학습 알고리즘(Algorithm 1)을 제공하여 T를 추정하고 손실을 보정하며 현재 모델과 함께 Naive한 노이즈 분류기의 β를 업데이트하는 과정을 교대한다.

실험 결과

연구 질문

  • RQ1인스턴스별 신뢰도 점수가 인스턴스 의존 노이즈 전이의 실현 가능 한 추정을 가능하게 하는가?
  • RQ2신뢰도 점수와 앵커 포인트를 사용하여 per-instance 대각 전이 확률과 클래스 간 뒤바꿈 확률을 어떻게 추정하는가?
  • RQ3인스턴스 수준 forward correction(ILFC)이 합성 및 실데이터에서 인스턴스 의존 라벨 노이즈에 대한 강건성을 개선하는가?
  • RQ4신뢰도 점수가 노이즈 주석이 부분적으로만 사용 가능하거나 전혀 없는 경우에도(예: Clothing1M) 견고하고 유용한가?

주요 결과

  • ILFC는Baseline이 실패하는 높은 수준의 인스턴스 의존 노이즈 하에서도 강건한 성능을 달성한다.
  • 합성 데이터에서 ILFC는 forward correction, MAE, Lq-norm, Co-teaching보다 우수한 성능을 보이며 특히 노이즈 비율이 높을 때 두드러진다.
  • 실세계 데이터셋(SVHN, CIFAR-10)에서 ILFC는 상당한 IDN 하에서 더 빠른 수렴과 더 높은 정확도를 보인다.
  • Clothing1M에서 ILFC는 Forward, MAE, Lq-norm, Co-teaching을 능가하며 보고된 최고 정확도를 달성한다.
  • 신뢰도 점수가 왜곡되어도 방법이 효과적으로 작동하여 불완전한 신뢰도 추정에 대한 견고성을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.