Skip to main content
QUICK REVIEW

[논문 리뷰] Consistent Estimators for Learning to Defer to an Expert

Hussein Mozannar, David Sontag|arXiv (Cornell University)|2020. 06. 02.
Machine Learning and Algorithms참고 문헌 53인용 수 24
한 줄 요약

이 논문은 교차 엔트로피를 일반화하는 새로운 서피스 손실을 사용하여 비용 민감 학습으로의 새로운 감소를 통해 전문가에게 예측을 연기할 시점을 학습하기 위한 일관된 추정기를 제안한다. 이 방법은 분류기와 기각기(Rejector)를 함께 학습하여 이론적 일관성과 다양한 작업에서 강력한 경험적 성능을 달성하며, 전문가의 결정 레이블만으로도 가능하다.

ABSTRACT

Learning algorithms are often used in conjunction with expert decision makers in practical scenarios, however this fact is largely ignored when designing these algorithms. In this paper we explore how to learn predictors that can either predict or choose to defer the decision to a downstream expert. Given only samples of the expert's decisions, we give a procedure based on learning a classifier and a rejector and analyze it theoretically. Our approach is based on a novel reduction to cost sensitive learning where we give a consistent surrogate loss for cost sensitive learning that generalizes the cross entropy loss. We show the effectiveness of our approach on a variety of experimental tasks.

연구 동기 및 목표

  • 실제 의사결정 과정에서 전문가의 참여를 무시하는 기계학습 알고리즘의 격차를 해소하기 위해.
  • 전체 레이블이 아닌 전문가의 결정 레이블만을 사용하여 언제 예측을 하며 언제 전문가에게 위임할지를 학습하는 방법을 개발하기 위해.
  • 제한된 감독 하에서도 학습 과정의 이론적 일관성을 확보하기 위해.
  • 교차 엔트로피 손실을 비용 민감 학습으로 일반화하여 더 뛰어난 안정성과 성능을 향상시키기 위해.
  • 다양한 실제 예측 작업에서 제안된 방법의 경험적 검증을 위해.

제안 방법

  • 전문가에게 예측을 연기할 시점을 학습하는 문제를 비용 민감 학습 문제로 감소시키는 접근법을 제안한다.
  • 비용 민감 설정으로의 교차 엔트로피 손실을 일반화하는 새로운 서피스 손실 함수를 도입한다.
  • 이 일관된 서피스 손실을 사용하여 분류기와 기각기를 함께 학습한다.
  • 이론적 분석을 통해 서피스 손실을 최소화하면 최적의 연기 정책 추정이 일관되게 수렴함을 증명한다.
  • 부분적 감독 하에서 작동하며, 전체 레이블이 아닌 전문가의 결정만 필요하다.
  • 알고리즘은 확장 가능하며 다양한 예측 작업에 적용 가능하도록 설계되어 있다.

실험 결과

연구 질문

  • RQ1전체 레이블이 아닌 전문가의 결정 뿐만으로도 신뢰할 수 있는 연기 정책을 학습할 수 있는가?
  • RQ2부분적 감독 하에서 최적의 연기 전략에 대한 일관된 추정기를 구성하는 것이 가능한가?
  • RQ3교차 엔트로피 손실을 비용 민감 학습으로 일반화하여 최적화를 향상시킬 수 있는가?
  • RQ4제안된 방법이 실제 연기 작업에서 기존의 베이스라인을 능가하는가?
  • RQ5이 방법은 최소한의 가정 하에 다양한 도메인에 효과적으로 적용될 수 있는가?

주요 결과

  • 제안된 서피스 손실은 이론적 일관성을 보장하여, 데이터가 증가함에 따라 학습된 정책이 최적의 정책으로 수렴함을 의미한다.
  • 의료 진단 및 이미지 분류를 포함한 다양한 벤치마크 작업에서 강력한 경험적 성능을 달성한다.
  • 제한된 전문가 감독 하에서도 기존의 베이스라인 대비 정확도와 연기 품질 측면에서 뛰어난 성능을 보인다.
  • 이론적 분석을 통해 서피스 손실을 최소화하면 비용 민감 제약 조건 하에서 최적의 의사결정이 이루어짐을 확인한다.
  • 프레임워크는 강건하고 일반화 가능하여 다양한 실제 환경에서 효과를 입증한다.
  • 전체 레이블 주석이 필요 없이도 연기 시점을 효과적으로 학습할 수 있도록 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.