QUICK REVIEW

[論文レビュー] Achieving Fairness through Adversarial Learning: an Application to Recidivism Prediction

Christina Wadsworth, Francesca Vera|arXiv (Cornell University)|Jun 30, 2018

Ethics and Social Impacts of AI参考文献 11被引用数 117

ひとこと要約

本論文は、差別的偏りを減らしつつ再犯予測を行う敵対的に誘導されたニューラルネットワークを訓練し、公平性の定義に近いパリティまたはオッズの等価性を達成し、BrowardデータセットでCOMPASより高い精度を達成する。

ABSTRACT

Recidivism prediction scores are used across the USA to determine sentencing and supervision for hundreds of thousands of inmates. One such generator of recidivism prediction scores is Northpointe's Correctional Offender Management Profiling for Alternative Sanctions (COMPAS) score, used in states like California and Florida, which past research has shown to be biased against black inmates according to certain measures of fairness. To counteract this racial bias, we present an adversarially-trained neural network that predicts recidivism and is trained to remove racial bias. When comparing the results of our model to COMPAS, we gain predictive accuracy and get closer to achieving two out of three measures of fairness: parity and equality of odds. Our model can be generalized to any prediction and demographic. This piece of research contributes an example of scientific replication and simplification in a high-stakes real-world application like recidivism prediction.

研究の動機と目的

高リスクの再犯予測における公平性を促進し、COMPASのような既存スコアの偏りに対処する。
再犯予測モデルから人種情報を取り除く敵対的トレーニングフレームワークを提案する。
公開データの Broward County データ上で、COMPASおよびベースラインモデルと比較した公平性と精度を評価する。
他の予測や属性に対する適用性/一般化可能性を示す。

提案手法

再犯確率 hat{Y} を出力する予測子 N を用いる。
予測子のロジットからデモグラフィック D を予測しようとする敵対者 A を付加する（オッズの等価性のためには Y も扱う）。
損失 Ly（予測子）と Ld（敵対者）を用いて、L = Ly - alpha * Ld を最適化し、パリティまたはオッズの等価性を促す。
AUC と公平性ギャップで評価：High Risk Gap、FP Gap、FN Gap、さらにはキャリブレーショングラフ。
ハイパーパラメータ（層数、alpha、学習率）を調整して Ld を最大化し、その後 Ly を最小化。

実験結果

リサーチクエスチョン

RQ1敵対的設定によって再犯予測から人種情報を削除できるか、精度を犠牲にせずに？
RQ2Broward COMPASデータセット上で、モデルは人種別の均等性（demographic parity）とオッズの等価性にどれだけ近づくことができるか？
RQ3公正性基準を達成しつつ、敵対的モデルは精度でCOMPASを上回るか？
RQ4このアプローチは他の予測や保護属性に一般化可能か？

主な発見

敵対的モデルは偏りのギャップを大幅に低減する：High Risk Gap 0.02、FN Gap 0.02、FP Gap 0.01。
敵対的モデルは精度でより高く（AUC 0.70）、COMPAS（AUC 0.66）より高く、公平性目標にも近い。
ベースライン再犯モデルと比較して、敵対的モデルはパリティ/オッズの等価性の改善をより大きく示しつつ、精度を維持。
Bechavod、Zafar、Hardt などの公平性ベースラインと比較して、選択された敵対的モデルは競争力のFP/FNギャップを達成し、AUCは優れているか同等。
ケーススタディは現実の影響を示し、具体的な受刑者の事例で COMPAS が敵対的予測と乖離することを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。