Skip to main content
QUICK REVIEW

[논문 리뷰] Inherent Tradeoffs in Learning Fair Representations

Han Zhao, Geoffrey J. Gordon|arXiv (Cornell University)|2019. 06. 19.
Ethics and Social Impacts of AI참고 문헌 50인용 수 28
한 줄 요약

이 논문은 통계적 평등성 하에서 정당한 분류기의 연합 오차에 대한 기본 정보이론적 하한을 설정하며, 그룹 간 기저율이 다를 경우 어떤 정당한 분류기라도 적어도 한 그룹에서는 최소 오차를 초래해야 한다고 증명한다. 이는 기저율이 다를 경우 정당성 제약 조건이 정량적으로 정량화된 방식으로 정확도를 본질적으로 제한한다는 것을 보여준다. 이 하한을 효율적으로 계산하기 위해 TV-Barycenter 문제를 도입하고, 오рак루 베이즈 분류기들을 사용하는 최적의 랜덤화된 분류기를 제안하여 이를 검증한다.

ABSTRACT

Real-world applications of machine learning tools in high-stakes domains are often regulated to be fair, in the sense that the predicted target should satisfy some quantitative notion of parity with respect to a protected attribute. However, the exact tradeoff between fairness and accuracy is not entirely clear, even for the basic paradigm of classification problems. In this paper, we characterize an inherent tradeoff between statistical parity and accuracy in the classification setting by providing a lower bound on the sum of group-wise errors of any fair classifiers. Our impossibility theorem could be interpreted as a certain uncertainty principle in fairness: if the base rates differ among groups, then any fair classifier satisfying statistical parity has to incur a large error on at least one of the groups. We further extend this result to give a lower bound on the joint error of any (approximately) fair classifiers, from the perspective of learning fair representations. To show that our lower bound is tight, assuming oracle access to Bayes (potentially unfair) classifiers, we also construct an algorithm that returns a randomized classifier that is both optimal (in terms of accuracy) and fair. Interestingly, when the protected attribute can take more than two values, an extension of this lower bound does not admit an analytic solution. Nevertheless, in this case, we show that the lower bound can be efficiently computed by solving a linear program, which we term as the TV-Barycenter problem, a barycenter problem under the TV-distance. On the upside, we prove that if the group-wise Bayes optimal classifiers are close, then learning fair representations leads to an alternative notion of fairness, known as the accuracy parity, which states that the error rates are close between groups. Finally, we also conduct experiments on real-world datasets to confirm our theoretical findings.

연구 동기 및 목표

  • 실제 세계의 데이터 분포 하에서 정의된 정당성(통계적 평등성)과 정확도 간의 기본 상충관계를 이해하기 위해.
  • 기저율이 다를 경우 정의된 정당성 제약 조건 하에서 그룹 간 최소 가능한 연합 오차를 특성화하기 위해.
  • 베이즈 분류기 접근이 가능한 조건 하에서 정의된 정당성 제약 조건을 만족하면서도 최적의 정확도를 달성하는 알고리즘을 개발하기 위해.
  • 특정 조건 하에서 정의된 정당한 표현 학습이 정의된 정당성 외의 다른 정의, 예를 들어 정확도 평등성과 같은 정의로 이어질 수 있는지 탐색하기 위해.
  • 보호된 속성이 두 개 이상의 값을 가질 경우 정의된 정당성-정확도 상충관계 하한을 효율적으로 계산하는 방법을 제공하기 위해.

제안 방법

  • Kullback-Leibler 발산과 그룹 기저율을 사용하여 통계적 평등성 하에서 정당한 분류기의 그룹별 오차 합에 대한 정보이론적 하한을 유도한다.
  • 오라클 기반의 그룹별 베이즈 분류기 접근이 가능한 조건 하에서 최적의 정확도와 정당성을 동시에 달성하는 랜덤화된 분류기 구성 방법을 제안한다.
  • 두 개 이상의 그룹이 있는 경우 총변동 거리 기반으로 선형 프로그래밍 문제로 하한 계산을 공식화하며, 이를 TV-Barycenter 문제로 명명한다.
  • 제안된 랜덤화된 분류기가 주어진 가정 하에서 하한을 달성함을 보여줌으로써 하한이 정보이론적으로 날카롭다는 것을 증명한다.
  • 그룹 간 베이즈 최적 분류기가 유사할 경우 정의된 정당한 표현 학습이 정확도 평등성으로 이어지는 조건을 분석한다. 정확도 평등성은 그룹 간 오차율이 유사한 것을 의미한다.
  • 실제 세계의 데이터셋에서 이론적 결과를 실험적으로 검증하여 상충관계와 유도된 하한의 날카로움을 확인한다.

실험 결과

연구 질문

  • RQ1기저율이 서로 다른 그룹 간에서 기저율이 다를 경우, 통계적 평등성을 만족하는 어떤 분류기라도 반드시 겪는 최소 연합 오차는 무엇인가?
  • RQ2통계적 평등성 하에서 최적의 정확도와 정당성을 동시에 만족하는 분류기를 구성할 수 있으며, 만약 가능하다면 어떤 가정 하에서 가능한가?
  • RQ3보호된 속성이 두 개 이상의 값을 가질 경우, 정의된 정당성-정확도 상충관계 하한을 효율적으로 계산하는 방법은 무엇인가?
  • RQ4정의된 정당한 표현 학습이 정의된 정당성 외에 정확도 평등성을 이끌어내는 조건는 무엇인가?
  • RQ5근사적인 정의된 정당성 제약 조건이 달성 가능한 정확도에 미치는 영향은 무엇이며, 이를 어떻게 정량화할 수 있는가?

주요 결과

  • 기저율이 그룹 간으로 다를 경우, 통계적 평등성을 만족하는 어떤 분류기라도 최소한의 연합 오차를 겪어야 하며, 이는 정의된 정당성과 정확도 간의 본질적 상충관계를 보여준다.
  • 그룹별 오차 합에 대한 하한은 정보이론적으로 날카롭고, 오라클 베이즈 분류기들로부터 구성된 랜덤화된 분류기를 통해 달성될 수 있다.
  • 두 개 이상의 그룹이 있는 경우, 하한은 선형 프로그래밍 문제를 풀어 효율적으로 계산할 수 있으며, 저자들이 TV-Barycenter 문제로 명명한 문제이다.
  • 기저율이 다를 경우 하한은 엄밀히 양수이므로, 정의된 정당성을 달성하기 위해서는 전체 정확도에 어느 정도의 손실이 불가피하다는 것을 의미한다.
  • 만약 그룹 간 베이즈 최적 분류기가 유사하다면, 정의된 정당한 표현 학습은 오차율이 그룹 간에 비슷한 정확도 평등성을 이끌어낼 수 있다.
  • 실제 세계의 데이터셋에 대한 실험 결과는 이론적 상충관계와 유도된 하한의 날카로움을 확인한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.