QUICK REVIEW

[論文レビュー] Interpretable Fairness via Target Labels in Gaussian Process Models.

Thomas Kehrenberg, Zexun Chen|arXiv (Cornell University)|Oct 12, 2018

Gaussian Processes and Bayesian Inference参考文献 14被引用数 4

ひとこと要約

本論文は、バイアスを制御するための潜在的ターゲット出力を導入することで、ガウス過程モデルにおける公平性の統一的で解釈可能なフレームワークを提案する。公平性を制約付き最適化ではなく周辺化として定式化することにより、市販のツールを用いた安定した学習が可能になり、ターゲットレートを直接制御することで、従来の方法で必要な非直感的なハイパーパrameterを回避できる。

ABSTRACT

The issue of fairness in machine learning models has recently attracted a lot of attention as ensuring it will ensure continued confidence of the general public in the deployment of machine learning systems. We focus on mitigating the harm incurred by a biased machine learning system that offers better outputs (e.g. loans, job interviews) for certain groups than for others. We show that bias in the output can naturally be controlled in probabilistic models by introducing a latent target output. This formulation has several advantages: first, it is a unified framework for several notions of group fairness such as Demographic Parity and Equality of Opportunity; second, it is expressed as a marginalisation instead of a constrained problem; and third, it allows the encoding of our knowledge of what unbiased outputs should be. Practically, the second allows us to avoid unstable constrained optimisation procedures and to reuse off-the-shelf toolboxes. The latter translates to the ability to control the level of fairness by directly varying fairness target rates. In contrast, existing approaches rely on intermediate, arguably unintuitive, control parameters such as covariance thresholds.

研究の動機と目的

特定のデモグラフィックグループに有利なバイアスのある出力を軽減することで、機械学習モデルにおける公平性を改善すること。
デモグラフィックパリティや同等の機会といった、複数のグループ公平性の概念を統合的に捉えるフレームワークを開発すること。
不安定な制約付き最適化に代えて、周辺化に基づくアプローチを用いることで、学習の安定性を向上させること。
公平性レベルを直接指定可能なターゲット公平性レートを用いることで、抽象的なハイパーパrameterに依存しない直感的な公平性の調整を可能にすること。

提案手法

個々の個人に対する望ましいバイアスのない予測を表すために、潜在的ターゲット出力変数を導入する。
公平な予測を、入力、潜在的ターゲット、観測出力の連合分布の周辺化としてモデル化する。
入力と出力の関係を、潜在的ターゲットに条件づけたガウス過程回帰でモデル化する。
公平性制約をハード制約としてではなく、潜在的ターゲット空間における再重み付けまたは周辺化として表現する。
制約付き最適化を回避することで、市販のGP推論ツールを活用でき、実用的な展開が可能になる。
ユーザーが直接ターゲット公平性レート（例：望ましいデモグラフィックパリティまたは機会レート）を指定できるようにする。

実験結果

リサーチクエスチョン

RQ1ガウス過程モデルにおける公平性を、デモグラフィックパリティや同等の機会といった複数の定義にわたって統一的に扱う方法は何か？
RQ2確率的モデルにおいて、不安定な制約付き最適化手順に依存せずに公平性を達成できるか？
RQ3抽象的なハイパーパrameterではなく、解釈可能なユーザー指定ターゲットレートを用いることで、公平性をどの程度制御できるか？
RQ4周辺化に基づく定式化は、制約付きアプローチと比較して、安定性と性能の点でどの程度優れているか？

主な発見

制約付き最適化を回避することで、標準的なGP推論ツールボックスの使用が可能となり、安定した学習が達成された。
ターゲットレートを直接指定することで、公平性が直接制御可能となり、実務家にとって直感的なインターフェースが提供された。
フレームワークは、単一の確率的定式化の下で複数の公平性定義を自然に統合する。
従来の手法で用いられる共分散閾値のような、中間的な解釈が難しいパrameterに依存しなくなった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。