Skip to main content
QUICK REVIEW

[論文レビュー] A Reductions Approach to Fair Classification

Alekh Agarwal, Alina Beygelzimer|arXiv (Cornell University)|Mar 6, 2018
Ethics and Social Impacts of AI参考文献 24被引用数 111
ひとこと要約

本論文は、フェア性を二値分類において一般的に強制する方法を提示する。公正な分類をコスト感度学習の一連の問題へ還元することで、フェア性制約の下で最小の実証誤差を持つランダム化分類器を実現する。分類器をブラックボックスとして扱い、さまざまなフェアネス定義に対して有限サンプル保証を提供する。

ABSTRACT

We present a systematic approach for achieving fairness in a binary classification setting. While we focus on two well-known quantitative definitions of fairness, our approach encompasses many other previously studied definitions as special cases. The key idea is to reduce fair classification to a sequence of cost-sensitive classification problems, whose solutions yield a randomized classifier with the lowest (empirical) error subject to the desired constraints. We introduce two reductions that work for any representation of the cost-sensitive classifier and compare favorably to prior baselines on a variety of data sets, while overcoming several of their disadvantages.

研究の動機と目的

  • 保護属性に関して、二値分類におけるフェアネスを動機づけ、形式化する。
  • 任意の分類器ファミリに対して機能する、フェアな分類をコスト感度学習へ還元する方法を提供する。
  • フェアネス制約の下でランダム化分類器が最良の精度を達成できるようにする。
  • テスト時の保護属性を必要とせずにフェアネスを達成するための有限サンプル保証と実用的なアルゴリズムを提供する。

提案手法

  • 条件付きモーメントに対する線形不等式としてフェアネスを定式化する:M mu(h) <= c。DPとEOを特別なケースとして捉える。
  • 制約付き経験的問題をラグランジュ乗数とノーリグレット最適化フレームワークを用いて鞍点問題の定式化に還元する。
  • λプレーヤーには指数勾配(Exponential Weights)アルゴリズムを用い、hプレーヤーには最良応答のコスト感度分類器を用いる。
  • 現在の乗数を組み込んだ構築コストを用いたコスト感度分類問題としてhプレーヤーの最良応答を表現する。
  • サブ最適性、Rademacher複雑性による統計的誤差、およびフェアネス制約違反を結ぶ有限サンプル保証を提供する。
  • 必要に応じて決定的な分類器を得るための乗数のグリッド探索の指針を提供する。)

実験結果

リサーチクエスチョン

  • RQ1DPやEOといった正式なフェアネス制約の下で、分類器ファミリを制限することなく二値分類をどのように実行できるか。
  • RQ2ブラックボックス分類器を還元フレームワーク内で再利用して、フェアネス制約下で最も低い実証誤差を達成できるか。
  • RQ3還元されたコスト感度問題を解く際の精度とフェアネスに関する有限サンプル保証は何か。
  • RQ4ラグランジュ乗数を介してフェアネス制約をコスト感度学習に効果的に組み込むにはどうすればよいか。
  • RQ5精度とフェアネスのトレードオフを達成する際に、ランダム化分類器と決定的分類器を用いることの影響は何か。

主な発見

  • フェアネス制約の下で最も低い実証誤差を実現できるコスト感度分類問題の系列。
  • λプレーヤーに対する指数勾配を用いた鞍点アルゴリズムは、nu近似の鞍点を達成し、サブ線形のサブオプティマリティを達成する。
  • このアプローチは、条件付きモーメントに対する線形不等式として表現できる多くのフェアネス定義(DPおよびEOを含む)をカバーする。
  • 理論的保証は、統計的誤差(Rademacher複雑性を介して)と最適化誤差を最終分類器の性能に結びつける。
  • 例は、DPとEOがこのフレームワーク内で特定のコスト構成と反復境界につながる様子を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。