Skip to main content
QUICK REVIEW

[論文レビュー] Fair Normalizing Flows

Mislav Balunović, Anian Ruoss|arXiv (Cornell University)|Jun 10, 2021
Adversarial Robustness in Machine Learning被引用数 5
ひとこと要約

Fair Normalizing Flows (FNF) は、感応属性の異なるグループの潜在分布間の統計的距離を最小化する正規化フローとしてエンコーダーをモデル化することにより、公平な表現を学習するための新規手法である。正確な尤度計算を可能にすることで、FNF は敵対的精度の証明可能な上界(≤ (1+∆)/2)を提供し、感応属性がランダムな当てずっぽうを超えて復元されないことを保証する。一方で、下流タスクにおける高い汎用性を維持する。

ABSTRACT

Fair representation learning is an attractive approach that promises fairness of downstream predictors by encoding sensitive data. Unfortunately, recent work has shown that strong adversarial predictors can still exhibit unfairness by recovering sensitive attributes from these representations. In this work, we present Fair Normalizing Flows (FNF), a new approach offering more rigorous fairness guarantees for learned representations. Specifically, we consider a practical setting where we can estimate the probability density for sensitive groups. The key idea is to model the encoder as a normalizing flow trained to minimize the statistical distance between the latent representations of different groups. The main advantage of FNF is that its exact likelihood computation allows us to obtain guarantees on the maximum unfairness of any potentially adversarial downstream predictor. We experimentally demonstrate the effectiveness of FNF in enforcing various group fairness notions, as well as other attractive properties such as interpretability and transfer learning, on a variety of challenging real-world datasets.

研究の動機と目的

  • 既存の公平な表現学習手法の限界、すなわち、強い敵対的攻撃者が潜在表現から感応属性を復元できることを是正すること。
  • 下流の予測器が学習済み表現から感応属性を正確に推定できないように保証することで、証明可能な公平性の保証を提供すること。
  • 可逆的でフローに基づくエンコーダーを用いて公平性を強制しつつ、下流の予測タスクにおける高い汎用性を維持すること。
  • 正規化フロー構造の可逆性を活かして、解釈可能性とアルゴリズム的レコーシブ(algorithmic recourse)を実現すること。

提案手法

  • FNF は、2つの感応属性グループ(a=0 および a=1)のデータをそれぞれ、分布 pZ0 および pZ1 を持つ潜在空間に写像する、2つの独立した正規化フローエンコーダー f0 と f1 を用いる。
  • 学習の目的関数は、pZ0 と pZ1 間の統計的距離 ∆ を最小化することで、異なるグループからの潜在表現が区別不能になるように保証する。
  • 潜在空間における正確な尤度計算により、任意の敵対的攻撃者の精度の上界が導出可能であり、≤ (1+∆)/2 となる。これは、デモグラフィックパラティーションやイコライズドオッズといった公平性指標に対してタイトである。
  • フローの可逆性により、潜在コードから元の入力を再構築可能であり、これによりアルゴリズム的レコーシブと解釈可能性が支援される。
  • 真の入力分布 p0 と p1 が未知の場合、密度推定を用いてそれらを近似する。理論的保証は、推定された分布に対しても拡張可能である。
  • 本手法はフローのアーキテクチャに依存しないため、RealNVP や Neural Spline Flows といった正規化フローの進展と統合可能である。

実験結果

リサーチクエスチョン

  • RQ1標準的な敵対的訓練の限界を超えて、いかなる敵対的攻撃者も感応属性を復元できない、証明可能な公平な表現を学習可能か?
  • RQ2正規化フローにおける正確な尤度計算を活用することで、敵対的公平性に関するタイトで証明可能な上限をどのように導出できるか?
  • RQ3FNF は公平性を強制しつつ、どの程度高い下流予測タスクの汎用性を維持できるか?
  • RQ4可逆的表現を活かして、FNF はアルゴリズム的レコーシブと解釈可能性をサポートできるか?
  • RQ5真の分布ではなく推定された入力密度を用いた場合、公平性の保証はどの程度頑健か?

主な発見

  • Crime データセットにおいて、FNF はグループの潜在分布間の統計的距離 ∆ を 0.23(γ=0.90)まで低減し、感応属性の敵対的復元を顕著に制限した。
  • ∆≈0.23 の場合、敵対的精度の上界は ≤ (1+0.23)/2 = 0.615 となる。これは、いかなる敵対的攻撃者もランダム当てずっぽうを 11.5 パcent点を超えて上回ることはできないことを意味する。
  • Law School データセットでは、FNF がアルゴリズム的レコーシブを可能にした。例えば、LSAT スコアを 4.2~7.7 ポイント向上させることで、望ましい意思決定が得られることが同定された。結果は人種別に層別されている。
  • FNF を用いた転移学習では、公平性が保持された。Health Heritage Prize データセットでは、統計的距離が 0.99 から 0.31 に低下し、主な条件群における精度も 73.8% から 73.1% にわずかに低下した。
  • FNF は公平性を強制しつつも、高い下流タスクの精度(例:RealNVP を用いた Crime データセットで 85%、NSF を用いた場合も 85%)を維持しており、性能と公平性のトレードオフが有利であることを示した。
  • FNF は RealNVP と NSF の両アーキテクチャで同等の性能を達成しており、アーキテクチャの選択に対して頑健であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。