QUICK REVIEW

[논문 리뷰] Probably Approximately Metric-Fair Learning

Guy N. Rothblum, Gal Yona|arXiv (Cornell University)|2018. 03. 08.

Machine Learning and Algorithms참고 문헌 23인용 수 43

한 줄 요약

본 논문은 metric-fair 학습을 위한 느슨한 PACF 프레임워크를 도입하고 일반화 보장을 증명하며 선형 및 로지스틱 예측기에 대한 다항 시간 PACF 학습기를 제공하는 한편, 완전한 metric-공정성에 대한 어려움을 보인다.

ABSTRACT

The seminal work of Dwork {\em et al.} [ITCS 2012] introduced a metric-based notion of individual fairness. Given a task-specific similarity metric, their notion required that every pair of similar individuals should be treated similarly. In the context of machine learning, however, individual fairness does not generalize from a training set to the underlying population. We show that this can lead to computational intractability even for simple fair-learning tasks. With this motivation in mind, we introduce and study a relaxed notion of {\em approximate metric-fairness}: for a random pair of individuals sampled from the population, with all but a small probability of error, if they are similar then they should be treated similarly. We formalize the goal of achieving approximate metric-fairness simultaneously with best-possible accuracy as Probably Approximately Correct and Fair (PACF) Learning. We show that approximate metric-fairness {\em does} generalize, and leverage these generalization guarantees to construct polynomial-time PACF learning algorithms for the classes of linear and logistic predictors.

연구 동기 및 목표

완전한 metric-fairness를 approximate metric-fairness로 완화하여 전체 인구에 걸친 일반화를 가능하게 하는 동기를 부여한다.
공정성과 가능한 최상의 정확도 사이의 균형을 이루는 프레임워크로서 PACF 학습을 개발한다.
Rademacher 복잡도를 사용하여 approximate metric-fairness에 대한 일반화 경계를 확립한다.
선형 및 로지스틱 예측기에 대한 효율적인(다항 시간) PACF 알고리즘을 제공한다.
완전 MF에 대한 어려움과의 대조를 통해 느슨한 접근을 정당화한다.

제안 방법

매개변수 (α, γ)와 실패 확률 δ를 가진 근사 metric-fairness (MF)를 정의한다.
MF와 최적의 근사 MF 예측기에 상대적인 정확도 보장을 결합한 Probably Approximately Correct and Fair (PACF) 학습을 공식화한다.
Rademacher 복잡도를 사용하여 공정성-일반화 경계를 증명하고, MF로 학습하는 것이 모집단 MF를 의미하도록 보장한다.
경계된 경험적 MF 손실과 볼록 MF-위배 제약을 통해 선형 예측기(H_lin)에 대한 다항 시간의 완화된-PACF 학습기를 설계한다.
커널 기반의 비적합 학습과 다항 커널을 갖는 RHKS를 통한 볼록화로 로지스틱 예측기(H_{φ,L})로 확장하고, 완화된 PACF 결과를 얻는다.
완전 MF와 근사 MF를 대조하는 정보 이론적 및 계산적 어려움 논의를 제공한다.

실험 결과

연구 질문

RQ1근사 metric-fairness가 유한한 샘플에서 기본 모집단으로 일반화될 수 있는가?
RQ2MF 제약 하의 PACF 학습에 대한 샘플 복잡도와 일반화 보장은 무엇인가?
RQ3MF 하에서 선형 및 로지스틱 예측기에 대한 효율적인(다항 시간) PACF 학습기를 설계할 수 있는가?
RQ4MF를 (α, γ)로 완화하는 것이 최상의 근사 MF 예측기에 비해 정확도 보장에 어떤 영향을 미치는가?
RQ5완전 metric-fairness의 계산적 제약은 무엇이며, MF를 느슨하게 하는 것이 이러한 제약을 우회하는가?

주요 결과

근사 MF 일반화: 샘플에서의 경험적 MF가 모집단의 MF를 높은 확률로 의미한다 (Theorem 1.3).
정보 이론적 강력한 PACF 학습 가능성은 MF 클래스에 대한 표준 PAC 학습과 유사한 샘플 복잡도로 달성 가능하다.
선형 예측기(H_lin)에 대한 다항 시간의 완화된 PACF 학습기가 존재하며, 1/ε 매개변수 및 샘플 크기에다 다항시간 복잡도를 가진다.
커널 기반 임베딩으로 인해 Lipschitz 매개변수 L에 대한 지수적 의존성을 가지며 로지스틱 예측기(H_{φ,L})에 대한 다항 시간의 완화된 PACF 학습기가 존재한다.
완전 metric-fairness의 경우 일부 작업은 간단한 예측기에도 여전히 어렵고, MF를 근사하는 PACF로의 전환을 촉진한다.
H_lin은 느슨한 PACF 학습 가능성을 달성하며; H_{φ,L}은 커널화로 느슨한 의미에서 학습 가능하며; 둘 다 MF 제약 하에서 경쟁력 있는 정확도를 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.