QUICK REVIEW

[論文レビュー] Fairness in Criminal Justice Risk Assessments: The State of the Art

Richard A. Berk, Hoda Heidari|arXiv (Cornell University)|Mar 27, 2017

Crime Patterns and Interventions参考文献 22被引用数 27

ひとこと要約

この論文は、犯罪司法リスク評価における公平性について、形式的かつ多様な視点からの分析を提供し、しばしば互いに矛盾し合い、正確性とも衝突する6つの異なる公平性定義を特定している。数学的に、公平性、正確性、ベースレートの不均衡の間には避けられないトレードオフが存在することを示し、理想化された公平性の主張ではなく、透明で価値に基づいたトレードオフの意思決定を提唱している。

ABSTRACT

Objectives: Discussions of fairness in criminal justice risk assessments typically lack conceptual precision. Rhetoric too often substitutes for careful analysis. In this paper, we seek to clarify the tradeoffs between different kinds of fairness and between fairness and accuracy. Methods: We draw on the existing literatures in criminology, computer science and statistics to provide an integrated examination of fairness and accuracy in criminal justice risk assessments. We also provide an empirical illustration using data from arraignments. Results: We show that there are at least six kinds of fairness, some of which are incompatible with one another and with accuracy. Conclusions: Except in trivial cases, it is impossible to maximize accuracy and fairness at the same time, and impossible simultaneously to satisfy all kinds of fairness. In practice, a major complication is different base rates across different legally protected groups. There is a need to consider challenging tradeoffs.

研究の動機と目的

アルゴリズム意思決定の文脈において、犯罪司法リスク評価における公平性に関する概念的混乱を解消すること。
政策的・一般論議でしばしば混同される、複数の明確な公平性定義を特定し、形式化すること。
公平性、正確性、ベースレートの不均衡が実際には相いれず、トレードオフを伴うことを数学的に示すこと。
保護群の属性が予測子として含まれない場合でも、予測子における歴史的不平等の相関から公平性の侵害が生じ得ることを示すこと。
リスク評価システムにおける透明性を提唱し、利害関係者が競合する公平性と正確性の目標を明示的に重み付けできる調整可能なパラメータを備えること。

提案手法

著者たちは、真陽性率、偽陽性率、陽性予測値といった主要な公平性指標を、保護群ごとに定義・比較するための2×2の交差表フレームワークを用いている。
実世界の保釈データを用いて、統計的・機械学習的手法（例えばランダムフォレストやインプロセッシング公平性アルゴリズム）を適用し、公平性と正確性のトレードオフを実証的に示している。
黒人・白人の被験者など、異なる保護群に対して別々にモデルを適合させることで、条件付き使用正確性均等性を評価し、人種による予測子の重要性の構造的差異を明らかにしている。
性的均等性、等しい機会、予測の同一性といった公平性定義を分析し、一般条件下でそれらが数学的に不整合であることを示している。
コンピュータサイエンスおよび統計学の形式的証明（例：Kleinberg et al., 2016; Chouldechova, 2016）を用い、いかなるアルゴリズムでも同時にすべての公平性基準を満たすことは不可能であることを確立している。
トレードオフは調整可能なパラメータを通じて明示的にすべきであり、最終的な意思決定は技術的ではなく、政治的・価値判断であることを強調している。

実験結果

リサーチクエスチョン

RQ1複数の公平性定義が、1つのリスク評価モデルで共存可能か、それとも本質的に不整合か？
RQ2保護群間のベースレートの違い（例：若年層の黒人男性と高齢の白人女性）が、公平性指標およびモデル性能にどのように影響するか？
RQ3人種や性別といった保護属性を予測子として含めない場合、アルゴリズムによる公平性はどの程度達成可能か？
RQ4実世界の犯罪司法データにおいて、公平性、正確性、予測の同一性の間の定量的トレードオフはどの程度か？
RQ5異なる人種的背景のグループごとに別々にモデルを適合させた場合、公平性の結果にどのような影響が生じるか、そしてその公平性と透明性への意味は何か？

主な発見

リスク評価における公平性には少なくとも6つの明確な形式的定義が存在し、一般条件下では互いに不整合である。
正確性と公平性を同時に最大化することは、文脈によっては数学的に不可能であり、文脈に応じて形式的定理によって証明されている。
人種や性別を予測子として含めない場合でも、保護属性と正当な予測子（例：前科歴）との相関から、公平性の侵害が生じる。
異なる人種群ごとに別々にモデルを訓練した場合、偽陽性率や偽陰性率に顕著な差が生じ、等しい機会といった公平性指標が損なわれる。
ウィスコンシン州最高裁判所が2017年にCOMPASを判決要因として支持した判決は、こうした公平性と正確性のトレードオフが現実の政策に与える影響を示している。
すべての公平性懸念を技術的解決で解消することは不可能であり、どのトレードオフを受け入れるかの選択は、結局のところ科学的ではなく、政治的・規範的決定である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。