QUICK REVIEW

[論文レビュー] Calibration for the (Computationally-Identifiable) Masses

Úrsula Hébert-Johnson, Michael P. Kim|arXiv (Cornell University)|Nov 22, 2017

Computability, Logic, AI Algorithms参考文献 13被引用数 49

ひとこと要約

本稿では、計算的に有界な関数（例えば、小さな回路）によって特定可能なすべてのサブポピュレーションに対して正確な予測を保証する公平性基準「マルチキャリブレーション」を導入する。勾配降下に類似したアルゴリズムを提示し、保証された精度と公平性を達成する。これは、やや強い仮定のもとで、公平で正確な予測器が計算的に達成可能であることを示している。

ABSTRACT

As algorithms increasingly inform and influence decisions made about individuals, it becomes increasingly important to address concerns that these algorithms might be discriminatory. The output of an algorithm can be discriminatory for many reasons, most notably: (1) the data used to train the algorithm might be biased (in various ways) to favor certain populations over others; (2) the analysis of this training data might inadvertently or maliciously introduce biases that are not borne out in the data. This work focuses on the latter concern. We develop and study multicalbration -- a new measure of algorithmic fairness that aims to mitigate concerns about discrimination that is introduced in the process of learning a predictor from data. Multicalibration guarantees accurate (calibrated) predictions for every subpopulation that can be identified within a specified class of computations. We think of the class as being quite rich; in particular, it can contain many overlapping subgroups of a protected group. We show that in many settings this strong notion of protection from discrimination is both attainable and aligned with the goal of obtaining accurate predictions. Along the way, we present new algorithms for learning a multicalibrated predictor, study the computational complexity of this task, and draw new connections to computational learning models such as agnostic learning.

研究の動機と目的

予測器の学習過程におけるバイアスに起因するアルゴリズム的差別を解消すること。
計算量的制限付き関数クラスによって識別可能なすべてのサブポピュレーションに対して、キャリブレートされた予測を保証する公平性概念「マルチキャリブレーション」を構築すること。
マルチキャリブレートされた予測器が、高い予測精度を維持しながら、効率的に学習可能であることを示すこと。
マルチキャリブレーションとアグノスティックラーニングなどの計算学習モデルとの理論的関係を確立すること。
小さなラベル付きデータセットから、一般用途のアルゴリズムを提供し、敵対的またはノイズのある状況下でもマルチキャリブレートされた予測器を学習可能にすること。

提案手法

マルチキャリブレーションを公平性基準として提案：予測器が、特定の有界複雑度関数クラス C に属する関数によって定義されるすべての集合に対して、キャリブレーションされている場合、マルチキャリブレートと呼ぶ。
勾配降下に類似した反復的・ノーレグレット最適化アルゴリズムを設計し、少数のラベル付き例からマルチキャリブレート予測器を学習する。
連続的な予測出力を扱いながらもキャリブレーションの保証を維持するため、実数値出力の離散化スキームを導入する。
各サブグループにおける予測誤差を制御するため、α-キャリブレーションの概念を導入し、任意のサブグループにおける平均二乗誤差が、そのサブグループの最良の予測器の誤差から小さな加法的要因以内に収まるように保証する。
予測空間とサブグループ定義の構造を活用し、C 内のすべてのサブポピュレーションにおいて、段階的に誤差を低減するように予測を更新する。
反復回数における累積レグレットが非線形的であることを示すことで、アルゴリズムがマルチキャリブレート予測器に収束することを証明する。これは、すべての識別可能なサブグループにおいて予測誤差が最適水準に近づくことを示唆する。

実験結果

リサーチクエスチョン

RQ1計算的に有界な関数によって識別可能なサブグループすべてに対して、保護されたグループに限らず正確な予測を保証する公平性基準を設計可能か？
RQ2サブグループの数が指数的に多くても、マルチキャリブレート予測器を効率的に学習可能か？
RQ3マルチキャリブレーションは、等しいオッズやデモグラフィックパリティといった既存の公平性概念とどのように関係するか？
RQ4マルチキャリブレート予測器は、各サブグループの最良の予測器と比較して、小さな加法的誤差の範囲内で予測精度を達成可能か？
RQ5マルチキャリブレート予測器を学習する計算複雑性は何か？また、計算学習理論における既知の問題とどのように関係するか？

主な発見

マルチキャリブレーションは、クラス C に属する関数によって定義される任意のサブグループにおける予測誤差が、そのサブグループの最良の予測器の誤差から小さな加法的要因（6α）以内に収まるように保証する。
提案されたアルゴリズムは、仮説クラスのサイズと所望の精度に応じて、反復回数とサンプル複雑度が多項式的にスケーリングする。
クラス H に属する関数 h によって識別されるサブグループ S_v(h) に対して、予測器の平均二乗誤差は、そのサブグループの最適予測器の誤差よりも 6α 以内に収まる。
ノイズや敵対的状況に対してもロバストである。ノーレグレットオンライン学習の原則に依存しているため、i.i.d. でないデータに対しても自然に適応可能である。
このフレームワークは、マルチキャリブレーションとアグノスティックラーニングの間の正式な関係を確立し、マルチキャリブレーションがアグノスティックラーニングの公平性を考慮した変種であると示している。
理論的分析により、すべての集合 S(H) に対してキャリブレーションされた予測器は、計算的に識別可能なすべてのサブグループにおいて、H 内の最良の仮説と比較して、小さな加法的誤差の範囲内で同等以上の性能を示すことが証明された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。