QUICK REVIEW

[論文レビュー] A survey on measuring indirect discrimination in machine learning

Indrė Žliobaitė|arXiv (Cornell University)|Oct 31, 2015

Names, Identity, and Discrimination Research参考文献 19被引用数 89

ひとこと要約

本調査は、機械学習における間接的差別の検出を目的とした差別の測定法を体系的にレビューし、分類し、その性質を計算的に評価し、解釈可能性と信頼性の観点から、比率ベースの測定法よりも差分ベースの測定法（特に正規化差分）を推奨する。予測モデリングにおける公平性評価の統一的フレームワークを提供し、正当な特徴（例：資格）による層別化を重視することで、グループ間の公平な比較を確保する。

ABSTRACT

Nowadays, many decisions are made using predictive models built on historical data.Predictive models may systematically discriminate groups of people even if the computing process is fair and well-intentioned. Discrimination-aware data mining studies how to make predictive models free from discrimination, when historical data, on which they are built, may be biased, incomplete, or even contain past discriminatory decisions. Discrimination refers to disadvantageous treatment of a person based on belonging to a category rather than on individual merit. In this survey we review and organize various discrimination measures that have been used for measuring discrimination in data, as well as in evaluating performance of discrimination-aware predictive models. We also discuss related measures from other disciplines, which have not been used for measuring discrimination, but potentially could be suitable for this purpose. We computationally analyze properties of selected measures. We also review and discuss measuring procedures, and present recommendations for practitioners. The primary target audience is data mining, machine learning, pattern recognition, statistical modeling researchers developing new methods for non-discriminatory predictive modeling. In addition, practitioners and policy makers would use the survey for diagnosing potential discrimination by predictive models.

研究の動機と目的

機械学習で用いられる間接的差別の検出のための差別測定法について、包括的かつ体系的なレビューを提供すること。
計算的分析を通じて、中心的な差別測定法の性質と信頼性を評価すること。
実務家や研究者にとって最も解釈可能で頑健な測定法を特定・推奨すること。
公平性評価における合意の欠如を解消するため、多様なアプローチを一貫性のあるフレームワークに統合すること。
実務家が潜在的な差別を診断し、政策立案者が差別ののないAIの基準を策定するのを支援すること。

提案手法

数学的および概念的基盤に基づき、差別測定法を統計的、絶対的、条件付き、構造的タイプに分類する。
合成分類タスクを用いて、代表的な測定法（例：平均差分、正規化差分、AUC、インパクト比）の頑健性と解釈可能性を評価する。
オッズ比やインパクト比などの比率ベースの測定法と、平均差分や正規化差分などの差分ベースの測定法を、データの不均衡への感受性と解釈可能性の観点から比較する。
不正な扱いと正当な差別の区別を可能にするために、正当な特徴（例：資格）による層別化の原則を導入する。
妥当な比較を同質なサブグループ内で可能にするために、感受度スコアマッチングやその他の条件付き測定法を提案する。
正規化差分を主な測定法として推奨し、比率ベースの測定法は解釈のリスクが高いため避けるべきである。

実験結果

リサーチクエスチョン

RQ1機械学習モデルにおける間接的差別の検出に最も信頼性が高く解釈可能な差別測定法は何か？
RQ2さまざまなデータ分布において、比率ベースの測定法と差分ベースの測定法は、頑健性と解釈可能性の観点でどのように比較できるか？
RQ3正当な特徴（例：教育、経験）による母集団の層別化は、モデルの公平性評価を公正にする上で果たす役割は何か？
RQ4関連分野（例：特徴選択）から既存の測定法を、機械学習における差別測定にどのように適合できるか？
RQ5現在の公平性評価実務の限界は何か？そして、どのような方法論的改善によってそれらを克服できるか？

主な発見

オッズ比やインパクト比などの比率ベースの測定法は、解釈が難しく、特にデータの不均衡下では誤解を招きやすい。したがって、推奨されない。
正規化差分や非正規化平均差分などの差分ベースの測定法は、解釈がやすく、頑健であるため、主な公平性評価指標として推奨される。
中心的な測定法だけでは公平性評価に不十分である。これは、資格や経験などの正当なグループ間の差異を考慮していないためである。
資格や経験などの正当な特徴による母集団の層別化は、差別検出における誤検出を回避するために不可欠である。
未解明の差分や感受度スコアマッチングなどの条件付き測定法は、同質なサブグループ内での比較を可能にすることで、公平性評価を向上させる。
本調査は、多クラス、多目的、多保護的特徴設定における未解決の課題を浮き彫りにすることで、今後の研究の基盤を築いた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。