Skip to main content
QUICK REVIEW

[論文レビュー] Distribution-Specific Auditing For Subgroup Fairness

Daniel Hsu, Jizhou Huang|arXiv (Cornell University)|Jan 1, 2024
Bayesian Modeling and Causal Inference被引用数 1
ひとこと要約

本稿は、特徴量がガウス分布に従う場合に、二値分類器における部分群公平性の監査のための最初の多項式時間近似スキーム(PTAS)を提示する。これは、同次半空間のアグノスティック学習分野の最近の進展を活用したものである。ガウス仮定のもとでは、線形しきい値で定義される部分群における公平性違反の監査が効率的に可能であることが示され、一方で強力な暗号的仮定により、一般の半空間部分群に対する根本的な限界が生じる。

ABSTRACT

We study the problem of auditing classifiers for statistical subgroup fairness. Kearns et al. [Kearns et al., 2018] showed that the problem of auditing combinatorial subgroups fairness is as hard as agnostic learning. Essentially all work on remedying statistical measures of discrimination against subgroups assumes access to an oracle for this problem, despite the fact that no efficient algorithms are known for it. If we assume the data distribution is Gaussian, or even merely log-concave, then a recent line of work has discovered efficient agnostic learning algorithms for halfspaces. Unfortunately, the reduction of Kearns et al. was formulated in terms of weak, "distribution-free" learning, and thus did not establish a connection for families such as log-concave distributions. In this work, we give positive and negative results on auditing for Gaussian distributions: On the positive side, we present an alternative approach to leverage these advances in agnostic learning and thereby obtain the first polynomial-time approximation scheme (PTAS) for auditing nontrivial combinatorial subgroup fairness: we show how to audit statistical notions of fairness over homogeneous halfspace subgroups when the features are Gaussian. On the negative side, we find that under cryptographic assumptions, no polynomial-time algorithm can guarantee any nontrivial auditing, even under Gaussian feature distributions, for general halfspace subgroups.

研究の動機と目的

  • 公平性のための組み合わせ的部分群の監査の計算的非効率性、特に分布フリーな設定下での解決を図ること。
  • 特定の分布、特にガウス分布に焦点を当てることで、アグノスティック学習の進展と公平性監査のギャップを埋めること。
  • ガウス特徴量分布下での部分群公平性のための、証明可能な効率性と正しさを備えた監査アルゴリズムを提供すること。
  • 暗号的仮定のもとでは、良好な分布的設定(例えばガウス分布)下でも、このような監査の根本的限界を同定すること。

提案手法

  • ガウス分布下での同次半空間のアグノスティック学習に還元することで、部分群公平性監査を新規にフレームワーク化する。
  • Diakonikolasらの同次半空間のアグノスティック学習のPTASを適応し、加法的誤差保証を持つ公平性監査者を構築する。
  • 部分群の確率質量(a から b まで)における二分探索を用いて、公平性乖離が最大となる部分群を同定する。
  • 反復的に候補となる半空間を改善するための修正済みオракルベースループを採用し、n 回の反復における一様結合による集中限界を維持する。
  • 分布固有の方法でブースティングに類似した技術を適用し、経験的サンプル上で動作させることで、分布的性質の損失を回避する。
  • Lemma 3.6 に依拠し、公平性乖離 |dD(c, h)| の最大化を、不一致測度の符号の最適化に等価に置き換える。

実験結果

リサーチクエスチョン

  • RQ1特徴量がガウス分布に従う場合でも、一般問題の難易度を考慮すると、部分群公平性の監査を効率的に行うことは可能か?
  • RQ2特定分布に依存するアグノスティック学習の結果をどの程度活用して、部分群公平性監査のためのPTASを構築できるか?
  • RQ3データ分布が良好(例:ガウス分布)である場合でも、暗号的仮定のもとでは、公平性監査の根本的限界は何か?
  • RQ4このフレームワークは、対数凸分布下での一般半空間や論理積などのより包括的な部分群族へ拡張可能か?

主な発見

  • 特徴量がi.i.d.ガウス分布に従う場合に、同次半空間部分群に対する部分群公平性監査のための最初のPTASを提示する。実行時間は次元および逆精度に関して多項式的である。
  • ガウス仮定のもとでは、提案されたアルゴリズムは、高確率1−δで、公平性乖離に2ǫの加法的誤差バウンドを達成する。
  • アルゴリズムは、Prx∼D{h′} = 1/2 かつ |dN(c, h′)| ≥ maxh∈HN1/2 |dN(c, h)| − 2ǫ を満たす部分群 h′ を効果的に同定する。
  • 暗号的仮定のもとでは、一般半空間部分群の監査を非自明に保証する多項式時間アルゴリズムは存在しない、すなわち、ガウス特徴量下でも同様である。
  • このフレームワークは、同次半空間は効率的に監査可能であるが、一般半空間は標準仮定のもとで非効率的であるという重要なギャップを明らかにする。
  • 既存の一般半空間に対するアグノスティック学習手法は、依然として定数の加法的誤差を有しており、細粒度の公平性監査への応用を制限している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。