QUICK REVIEW

[論文レビュー] Why Is My Classifier Discriminatory?

Irene A. Chen, Fredrik Johansson|arXiv (Cornell University)|May 30, 2018

Artificial Intelligence in Healthcare被引用数 151

ひとこと要約

本論文は、公平性の差をバイアス、分散、ノイズに分解して予測モデルの差別を分析し、データ収集は精度を損なうことなく差別を低減することが多いと主張する。

ABSTRACT

Recent attempts to achieve fairness in predictive models focus on the balance between fairness and accuracy. In sensitive applications such as healthcare or criminal justice, this trade-off is often undesirable as any increase in prediction error could have devastating consequences. In this work, we argue that the fairness of predictions should be evaluated in context of the data, and that unfairness induced by inadequate samples sizes or unmeasured predictive variables should be addressed through data collection, rather than by constraining the model. We decompose cost-based metrics of discrimination into bias, variance, and noise, and propose actions aimed at estimating and reducing each term. Finally, we perform case-studies on prediction of income, mortality, and review ratings, confirming the value of this analysis. We find that data collection is often a means to reduce discrimination without sacrificing accuracy.

研究の動機と目的

データの文脈における公平性評価を、モデルを単に制約することだけでなく動機づける。
コストに基づく公平性の下で、差別のバイアス-分散-ノイズ分解を提案する。
各差別成分を推定し低減する手順を提供する。
データ収集と標的変数収集が実務タスクでの差別を低減する方法を示す。

提案手法

コストに基づく公平性（FPR、FNR、または0-1 loss）に対して、差別の源を分離するためのバイアス-分散-ノイズ分解を用いる。
ランダムな訓練集合上の期待差別を定義し、推定技法を提供する。
新しい特徴を必要とするサブ集団を特定するためにデータ収集の増加、サブサンプリング、クラスタリングを提案する。
学習曲線モデリングを適用して、訓練データの増加に伴う差別を予測する。
所得予測、ICU死亡率、書籍評価予測のケーススタディを行い手法を検証する。

実験結果

リサーチクエスチョン

RQ1予測モデルに寄与する差別の独立した源（バイアス、分散、ノイズ）は何か？
RQ2コストベースの公平性の実践で、これらの源を推定・分離するにはどうすればよいか？
RQ3追加データ収集や標的特徴収集は、精度を損なうことなく差別を低減できるか？
RQ4実世界のタスク（所得、死亡率、レビュー）における差別とその要因はどのように異なるか？

主な発見

差別はバイアス、分散、ノイズに分解でき、バイアスや分散の差はモデルやデータの問題を示し、ノイズの差は欠落した予測変数を示す。
訓練データを増やすと、偽陽性率と偽陰性率の両方が低下し、所得予測における差別レベルが低下する。
ノイズの推定値は複数のタスクでグループ間で異なり、モデルの選択やデータサイズを超えて差別に寄与する不均等な予測可能性（ノイズ）があることを示唆する。
クラスタリングは誤差格差の大きいサブポピュレーションを特定でき、差別を低減するための標的データ収集を導く。
ICU死亡率予測では、いくつかの民族グループが有意に異なる誤差率を示し、トピックモデリングは格差の大きいサブポピュレーションを明らかにする。
書籍評価の実験は、表現されていない性別を標的にサンプリングすることで、平均二乗誤差の差別の一部を除去できることを示唆する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。