[論文レビュー] Does mitigating ML's impact disparity require treatment disparity?
本論文はDisparate Learning Processes (DLPs) を分析し、それらが治療格差を間接的に実装しうること、同クラス内の差別を生み、精度-不均衡のトレードオフを最適でないことを示し、グループごとの閾値設定がDLPより優れている場合がある。
Following related work in law and policy, two notions of disparity have come to shape the study of fairness in algorithmic decision-making. Algorithms exhibit treatment disparity if they formally treat members of protected subgroups differently; algorithms exhibit impact disparity when outcomes differ across subgroups, even if the correlation arises unintentionally. Naturally, we can achieve impact parity through purposeful treatment disparity. In one thread of technical work, papers aim to reconcile the two forms of parity proposing disparate learning processes (DLPs). Here, the learning algorithm can see group membership during training but produce a classifier that is group-blind at test time. In this paper, we show theoretically that: (i) When other features correlate to group membership, DLPs will (indirectly) implement treatment disparity, undermining the policy desiderata they are designed to address; (ii) When group membership is partly revealed by other features, DLPs induce within-class discrimination; and (iii) In general, DLPs provide a suboptimal trade-off between accuracy and impact parity. Based on our technical analysis, we argue that transparent treatment disparity is preferable to occluded methods for achieving impact parity. Experimental results on several real-world datasets highlight the practical consequences of applying DLPs vs. per-group thresholds.
研究の動機と目的
- 機械学習における治療の平等性と影響の平等性の区別を動機づけ、形式化する。
- 保護属性を直接使用せずに、DLPが影響の平等性を達成できるかを評価する。
- DLPが間接的な治療格差または同一クラス内の差別を生じさせる条件を特徴づける。
- 現実の応用において、単純なグループ別閾値設定がDLPよりも優れているかを評価する。
提案手法
- Calders-Verwer (CV) ギャップと p-% ルールを影響の平等性指標として用い、二値保護特徴設定を形式化する。
- 訓練時には保護属性を用い、予測時には用いないDLP(Disparate Learning Processes)を記述する。
- CV および p-% 制約の下で、精度最大化のための直接的なグループ別閾値設定が最適であることを証明する。
- 同じ平等性制約の下で、グループ意識の閾値設定がDLPよりもサブ最適であることを示す。
- X が Z を全体的または部分的に符号化する条件と、DLPs への影響についての理論的結果を提供する。
- 合成データ、ケーススタディデータ、および公開データセットに基づく実証分析を行い、実務への含意を描く。
実験結果
リサーチクエスチョン
- RQ1DLPは、有害な治療格差を導入せずに影響の平等性を確実に達成できるか。
- RQ2CV および p-% 制約の下で、精度を最大化する最適な意思決定規則は何か。
- RQ3保護特性が他の特徴に冗長または部分的に符号化されている場合、DLPはグループ別閾値に対してどのように性能を発揮するか。
- RQ4実世界データセットを横断して、単純なグループ別閾値設定がDLPよりも同等以上の平等性を高い精度で達成できるか。
主な発見
- 保護属性に関する直接的な治療格差は、平等性の制約が存在するときに精度を最大化する最適解である。
- X が Z を完全に符号化する場合、十分強力な DLP は治療格差と同等になる。
- Z が X に部分的に符号化される場合、DLP は同一クラス内の差別と保護グループの一部のメンバーへの害を引き起こす可能性がある。
- DLP は、同じ平等性制約の下でグループ意識の閾値設定と比較して精度と影響の平等性のトレードオフがサブ最適である。
- 合成データ、CSの入学男女バイアスケーススタディ、公開データセットで、閾値設定がDLPよりも高い平等性を達成でき、精度も同等または向上することを示す。
- 閾値設定アプローチは、特定の精度でほぼ100%の p-% 平等性に近づくことができ、いくつかのデータセットでDLPベースの方法を上回る。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。