Skip to main content
QUICK REVIEW

[論文レビュー] A statistical framework for fair predictive algorithms

Kristian Lum, James E. Johndrow|arXiv (Cornell University)|Oct 25, 2016
Adversarial Robustness in Machine Learning参考文献 7被引用数 57
ひとこと要約

この論文は、保護される変数(例:人種)からの独立性を達成するために共変数を変換する統計的枠組みを提案する。条件付きモデリングを用いて、予測の正確性を維持したまま、保護される属性からの独立性を保証する。連鎖的な条件付きモデル(累積分布関数に基づく変換を適用する)を用いることで、予測が保護される属性に依存しないことを保証する。実証的に、AUCがわずかに低下する(0.72 対 0.71)ものの、再犯予測分布が人種グループ間でほぼ同一であることが示された。

ABSTRACT

Predictive modeling is increasingly being employed to assist human decision-makers. One purported advantage of replacing human judgment with computer models in high stakes settings-- such as sentencing, hiring, policing, college admissions, and parole decisions-- is the perceived "neutrality" of computers. It is argued that because computer models do not hold personal prejudice, the predictions they produce will be equally free from prejudice. There is growing recognition that employing algorithms does not remove the potential for bias, and can even amplify it, since training data were inevitably generated by a process that is itself biased. In this paper, we provide a probabilistic definition of algorithmic bias. We propose a method to remove bias from predictive models by removing all information regarding protected variables from the permitted training data. Unlike previous work in this area, our framework is general enough to accommodate arbitrary data types, e.g. binary, continuous, etc. Motivated by models currently in use in the criminal justice system that inform decisions on pre-trial release and paroling, we apply our proposed method to a dataset on the criminal histories of individuals at the time of sentencing to produce "race-neutral" predictions of re-arrest. In the process, we demonstrate that the most common approach to creating "race-neutral" models-- omitting race as a covariate-- still results in racially disparate predictions. We then demonstrate that the application of our proposed method to these data removes racial disparities from predictions with minimal impact on predictive accuracy.

研究の動機と目的

  • 偏ったデータに基づいて学習された機械学習モデルにおける不平等な予測の問題に対処すること、特に保護される属性(例:人種)が結果と相関している場合に焦点を当てる。
  • 保護される変数に関する情報を完全に除外せずに、保護される変数からの情報を除去する一般的で柔軟な手法を開発すること。
  • 予測と保護される変数の間の統計的独立性を強制することで公平性を確保すること、これは連続変数、離散変数、混合タイプの共変数に対しても有効である。
  • 調整プロセスにおける情報損失を最小限に抑えることで、高い予測性能を維持すること。
  • 階層モデルやノンパラメトリック回帰などの複雑なモデリング手法をサポートする、統計的に妥当で尤度に基づくアプローチを提供すること。

提案手法

  • 変換 $ g(x,z) = \widetilde{F}^{-1}(F_{x|z}(x)) $ を用い、$ \widetilde{x} $ が $ z $ に対して独立になるようにする。ここで $ F_{x|z} $ は $ x $ の条件付き累積分布関数である。
  • 各共変数 $ x_j $ について、適切な回帰手法(連続変数には線形モデル、二値変数にはロジスティック回帰、カウント変数にはゼロインflatedポアソンまたはネガティブバイノミアル)を用いて、条件付き分布 $ F_{x_j|\widetilde{z}^{(j)}} $ をモデル化する。
  • 多変量変換を逐次的に適用し、各 $ \widetilde{x}_j $ が $ z $ および以前に変換された変数 $ \widetilde{x}_{1:j-1} $ に依存するようにすることで、$ z $ に対して同時独立性を確保する。
  • 離散変数の場合、隣接する累積確率で定義される区間内で一様乱数を生成し、逆実現累積分布関数を用いて $ \widetilde{x}_j $ を生成することで、公平性を保持する。
  • 確率的変換に伴う不確実性を扱うために、複数の多重代入データセット($ M $)を生成し、それらの予測を平均化することで、安定性と不確実性の推定を向上させる。
  • モデルの適合度は、変換後の $ F_{x|z}(x|z) $ 値に対するコルモゴロフ=スミルノフ検定を用いて検証され、一様性の帰無仮説が棄却されないことで、独立性の達成が確認される。

実験結果

リサーチクエスチョン

  • RQ1保護される変数に関する情報を予測モデルから除去しつつ、予測正確性を維持する統計的枠組みを開発できるか?
  • RQ2公平性を統計的独立性として形式的に定義し、予測と保護される属性との間で強制できるか?
  • RQ3連続、二値、カウントの混合タイプの共変数を調整して公平性を達成するための有効なモデリング手法は何か?
  • RQ4提案手法が、モデル性能を著しく低下させることなく、再犯予測における人種的格差をどの程度低減できるか?
  • RQ5変換プロセスにおける不確実性を適切に定量化し、下流の予測に適切に伝搬できるか?

主な発見

  • 提案手法は、再犯データセットにおいて、予測と人種の間でほぼ完全な独立性を達成した。コルモゴロフ=スミルノフ検定では、1つの変数を除き、すべての変数について一様性の帰無仮説が棄却されなかった。
  • 調整後、再犯確率の経験的予測分布は人種グループ間でほぼ同一となり、調整前のモデルで見られた顕著な格差が解消された。
  • 調整済みモデルの受信者操作特性曲線下積分(AUC)は 0.72 であり、調整前のモデルの AUC(0.71)とほとんど差がなかった。これは、予測性能の低下が最小限であることを示している。
  • 調整済みモデルの AUC は、商業的に導入済みのリスク評価ツール(0.70)と同等またはわずかに優れており、実用的性能が優れていることを示している。
  • 人種が結果と相関している場合でも、保護される変数をモデルから完全に除外せずに、人種的バイアスを効果的に除去できた。これは、公平性を達成するためには保護される変数を除外する必要がないことを示している。
  • 確率的変換の不確実性を扱うために複数の多重代入データセットを用いたことで、安定した予測と適切な不確実性の定量化が実現された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。