QUICK REVIEW

[論文レビュー] The implicit fairness criterion of unconstrained learning

Lydia T. Liu, Max Simchowitz|arXiv (Cornell University)|Aug 29, 2018

Ethics and Social Impacts of AI被引用数 35

ひとこと要約

この論文は、制約のない機械学習が、最適化目的のおかげで、スコアが与えられたもとでの予測がグループメンバーシップと条件付き独立である「グループキャリブレーション」を暗黙的に好むことを示している。モデルが学習した結果の超過リスクによって、キャリブレーションからの逸脱が上限つきであることを証明すると同時に、分離性や独立性といった他の公平性基準に反することを示しており、制約のない学習においてキャリブレーションが実質的な公平性基準であることが浮き彫りになる。

ABSTRACT

We clarify what fairness guarantees we can and cannot expect to follow from unconstrained machine learning. Specifically, we characterize when unconstrained learning on its own implies group calibration, that is, the outcome variable is conditionally independent of group membership given the score. We show that under reasonable conditions, the deviation from satisfying group calibration is upper bounded by the excess risk of the learned score relative to the Bayes optimal score function. A lower bound confirms the optimality of our upper bound. Moreover, we prove that as the excess risk of the learned score decreases, it strongly violates separation and independence, two other standard fairness criteria. Our results show that group calibration is the fairness criterion that unconstrained learning implicitly favors. On the one hand, this means that calibration is often satisfied on its own without the need for active intervention, albeit at the cost of violating other criteria that are at odds with calibration. On the other hand, it suggests that we should be satisfied with calibration as a fairness criterion only if we are at ease with the use of unconstrained machine learning in a given application.

研究の動機と目的

制約のない機械学習において、明示的な公平性制約なしに自然に生じる公平性保証を明らかにすること。
標準的なリスク最小化の過程で、結果がスコアに対してグループメンバーシップと条件付き独立である「グループキャリブレーション」が暗黙的に達成されるかどうかを調査すること。
分離性や独立性といった他の公平性基準との間のトレードオフを定量化すること。
モデルの超過リスクに基づいてキャリブレーションからの逸脱の理論的上限を確立し、それを実世界のデータセットで実証的に検証すること。

提案手法

公平性基準からの逸脱を測る指標として、十分性（sufficiency）とキャリブレーションのギャップを定義する。十分性とは、P.Y|f(X)) = P.Y|f(X), A) がほとんど surely に成り立つこと。
十分性ギャップを E[|E[Y|f(X)] - E[Y|f(X), A]|] として形式化し、キャリブレーションギャップを E[|E[Y|f(X), A] - f(X)|] として定義する。
やや弱い正則性条件の下で、十分性ギャップが、ベイズ最適スコアに対する学習済みスコアの超過リスクによって上界つきであることを証明する。
この上界のタイトさを示す下界を確立し、これが最適性であることを確認する。
ロジスティック損失を用いた経験的リスク最小化により、Adult および Broward データセットでモデルを学習し、スコアの分位数ごとのビニングを用いてギャップを推定する。
複数のグループ属性（例：人種、性別、年齢）について、合成属性やスパースなグループのための分位数ビニングを含め、十分性、キャリブレーション、分離ギャップを評価する。

実験結果

リサーチクエスチョン

RQ1制約のない学習が、どのような条件下でグループキャリブレーションを暗黙的に達成するのか。
RQ2学習済みスコアの超過リスクと、そのキャリブレーションからの逸脱との関係は何か。
RQ3制約のない学習が、分離性と独立性基準をどの程度違反するのか。
RQ4キャリブレーションからの逸脱に関する理論的上限が、実世界のデータセットで実証的に検証可能か。
RQ5複数の重複するグループ属性にわたって、制約のない学習の性能はどのように変化するか。

主な発見

十分性ギャップ（結果がスコアに対してグループと条件付き独立であるという性質からの逸脱）は、ベイズ最適スコアに対する学習済みスコアの超過リスクによって上界つきである。
一致する下界により、この上界のタイトさが確認され、同様のリスク条件下で、他のアルゴリズムがより優れたキャリブレーションを達成できる可能性は低いことが示された。
超過リスクが低下するにつれて、分離性と独立性の違反が増加する。これは、キャリブレーションとこれらの公平性基準との間の根本的なトレードオフを示している。
Adult および Broward データセットにおける実証的結果から、制約のない学習（例：ロジスティック回帰）が、人種、性別、年齢、合成特徴など複数のグループ属性において強固なキャリブレーションを達成していることがわかった。
Broward データセットでは、訓練データが増えるにつれて十分性ギャップが減少するが、分離ギャップは約 0.05 で安定し、分離性の違反が持続することが示された。
小さなグループ質量では、キャリブレーションの上限が劣化し、理論的期待と一致する。また、実証的十分性ギャップ推定値はビニングの選択（例：10 ビン vs. 8 ビン）に敏感であるが、Adult データセットでは 10 ビンで信頼できる推定が可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。