QUICK REVIEW

[論文レビュー] Rawlsian Fairness for Machine Learning.

Matthew Joseph, Michael Kearns|arXiv (Cornell University)|Oct 29, 2016

Advanced Bandit Algorithms Research参考文献 21被引用数 49

ひとこと要約

本稿では、ロウルズ的公平性——特に機会の平等——を根拠とする機械学習アルゴリズムを提案し、オンライン意思決定における差別のを軽減する。改善されたレグレットバウンドを備えた公平なコンテキストバンドイットアルゴリズムと、バイアスを測定するための差別インデックスを導入し、標準的手法で見られる構造的差別的行動を避けることが示された。

ABSTRACT

Motivated by concerns that automated decision-making procedures can unintentionally lead to discriminatory behavior, we study a technical definition of fairness modeled after John Rawls' notion of equality of opportunity. In the context of a simple model of online decision making, we give an algorithm that satisfies this fairness constraint, while still being able to learn at a rate that is comparable to (but necessarily worse than) that of the best algorithms absent a fairness constraint. We prove a regret bound for algorithms in the linear contextual bandit framework that is a significant improvement over our technical companion paper [16], which gives black-box reductions in a more general setting. We analyze our algorithms both theoretically and experimentally. Finally, we introduce the notion of a discrimination index, and show that standard algorithms for our problem exhibit structured discriminatory behavior, whereas the fair algorithms we develop do not.

研究の動機と目的

自動意思決定システムにおける公平性を扱う。これらは意図せず差別的結果を生じる可能性がある。
ロウルズ的公平性——機会の平等——をオンライン学習における技術的制約として形式化する。
学習パフォーマンスを維持しながら公平性制約を満たすアルゴリズムを開発する。
アルゴリズム間での偏見行動を経験的に測定・比較するための差別インデックスを導入する。

提案手法

ロウルズの機会の平等の原則をオンライン意思決定における公平性制約に適応する。
線形コンテキストバンドイットフレームワーク内に、学習パフォーマンスと公平性のバランスを取った公平なアルゴリズムを設計する。
一般設定において、先行のブラックボックス還元手法よりも改善されたレグレットバウンドを導出する。
学習アルゴリズムにおける構造的差別的行動を定量化・検出するための差別インデックスを導入する。
理論的分析と実験的評価を用いて、公平性とパフォーマンスのトレードオフを検証する。
理論的レグレット分析と経験的検証を併用して、標準的および公平なアルゴリズムを比較する。

実験結果

リサーチクエスチョン

RQ1ロウルズ的公平性はオンライン機械学習システムにどのように形式的に定義・実装できるか？
RQ2学習のレグレットという観点から、ロウルズ的公平性を強制することによるパフォーマンスコストは何か？
RQ3差別インデックスは、標準的学習アルゴリズムにおける構造的差別的行動を効果的に検出し、定量化できるか？
RQ4本フレームワーク下で開発された公平なアルゴリズムは、標準的手法で観察される差別的パターンを回避するか？
RQ5提案された公平なアルゴリズムのレグレットは、制約なしのベースラインと比べてどうか？

主な発見

提案された公平なアルゴリズムは、技術的補足論文におけるブラックボックス還元手法よりも顕著な改善を達成したレグレットバウンドを実現した。
標準的手法は、差別インデックスによって測定された結果、構造的差別的行動を示しているが、提案された公平なアルゴリズムではそのような行動は見られない。
公平なアルゴリズムは、制約なしのアルゴリズムと比較してやや劣るが、学習パフォーマンスを標準的な水準で維持した。
差別インデックスは、標準的学習手法におけるバイアスパターンを的確に特定・定量化できた。
理論的および実験的結果から、公平なアルゴリズムがベースラインモデルで観察された差別的行動を回避することが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。