QUICK REVIEW
[論文レビュー] Wasserstein Fair Classification
Ray Jiang, Aldo Pacchiano|arXiv (Cornell University)|Jul 28, 2019
Ethics and Social Impacts of AI参考文献 44被引用数 38
ひとこと要約
Wasserstein-1距離を用いて出力と敏感属性の独立性を強制する公正分類アプローチを提案し、ペナルティ付きロジスティック回帰と高速なポスト処理バリアントを用い、公平性ベンチマークで実証的な効果を示す。
ABSTRACT
We propose an approach to fair classification that enforces independence between the classifier outputs and sensitive information by minimizing Wasserstein-1 distances. The approach has desirable theoretical properties and is robust to specific choices of the threshold used to obtain class predictions from model outputs. We introduce different methods that enable hiding sensitive information at test time or have a simple and fast implementation. We show empirical performance against different fairness baselines on several benchmark fairness datasets.
研究の動機と目的
- 分類における公正性の必要性と閾値ベースの独立性の限界を動機づける。
- モデル出力 S と敏感属性 A の独立性に基づく公正性の基準(SDP)を導入する。
- Wasserstein-1 distance to a barycenter を SDP を達成する最適輸送ベースの機構として定式化する。
- 実務で SDP を実現するための実用的な方法を二つ提供する(penalized logistic regression と post-processing)。
- ベンチマークデータセットにおいて、公平性ベースラインよりも実証的な改善を示す。
提案手法
- 信念変数 S を Y=1 となる条件付き確率として、A と X を与えたときのモデルの確率として定義する。
- SDP を提案し、Wasserstein-1 barycenter p_Sbar を用いてすべての敏感グループ a に対して p_Sa = p_Sbar となるよう要求する。
- SDP を達成する最適な後処理は、W1 を用いて各グループ分布 p_Sa を p_Sbar へ輸送し、期待されるクラス変更を最小化することを示す。
- 標準のロジスティック損失に、グループ分布とバリセンター間の W1 用語を加えた Wasserstein-1 Penalized Logistic Regression 目的を開発する(重み付きおよび推定時のバリアントを含む)。
- 感度属性をテスト時特徴量に含めず、W1 ペナルティを計算するために使用する人口統計的に blind なバリアントを提供する。
- 近似的な W1 輸送(分位点マッチング)に基づくより単純な post-processing 法を提供する。
実験結果
リサーチクエスチョン
- RQ1固定閾値を超えた独立性のない出力を超えて、分類器の出力と敏感属性の独立性をどのように強制できるか。
- RQ2Wasserstein-1 distance to a barycenter(SDP)は、公平性を達成しつつ予測の変更を最小化する最適性があるか。
- RQ3実用的でスケーラブルな手法(ペナルティ付きロジスティック回帰と post-processing)が、予測有用性の最小限の損失で強い人口統計的平等性を実現できるか。
- RQ4標準ベースラインに対する Wasserstein ベースの公正性手法の実証的性能はどうか(ベンチマークデータセットで)?
主な発見
- Wasserstein-1 barycenter transport は、元の予測への変更を最小限に抑えつつ、グループ出力分布を揃えることで SDP を達成する。
- 最適性: すべてのグループ分布を W1 barycenter に輸送することが、総予測変更量を最小化する。
- 人口統計的に blind なテスト時バリアントは、デプロイ時に敏感属性を要求せずに有効である。
- 2つの実用的実装(ペナルティ付きロジスティック回帰と post-processing)は、ベンチマークデータセットでいくつかの公平性ベースラインを上回る。
- 複数のデータセット(例: Adult、German、Bank Marketing、Community & Crime)での実証結果は、公平性指標に関してアプローチの競争力を示す。
- この手法は、厳密な post-processing オプションと訓練時のペナルティアプローチの双方を提供し、デプロイ環境に柔軟性を与える。)],
- table_headers: []
- table_rows: []
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。