Skip to main content
QUICK REVIEW

[论文解读] A Reductions Approach to Fair Classification

Alekh Agarwal, Alina Beygelzimer|arXiv (Cornell University)|Mar 6, 2018
Ethics and Social Impacts of AI参考文献 24被引用 111
一句话总结

本文提出一种在二元分类中强制实现公平性的通用方法,通过将公平分类问题简化为一系列成本敏感分类问题来实现,在公平约束下能够获得最小经验误差的随机分类器。它将分类器视为一个黑箱,并在各种公平性定义下提供有限样本保证。

ABSTRACT

We present a systematic approach for achieving fairness in a binary classification setting. While we focus on two well-known quantitative definitions of fairness, our approach encompasses many other previously studied definitions as special cases. The key idea is to reduce fair classification to a sequence of cost-sensitive classification problems, whose solutions yield a randomized classifier with the lowest (empirical) error subject to the desired constraints. We introduce two reductions that work for any representation of the cost-sensitive classifier and compare favorably to prior baselines on a variety of data sets, while overcoming several of their disadvantages.

研究动机与目标

  • 激励并将二元分类在受保护属性方面的公平性形式化。
  • 提供一个将公平分类归约到成本敏感学习的方案,适用于任意分类器族。
  • 允许随机化分类器在公平约束下达到最佳准确率。
  • 提供有限样本保证和实现公平性的实际算法,而不需要在测试时的受保护属性。

提出的方法

  • 将公平性表述为条件矩的线性不等式:M mu(h) <= c,将 DP 和 EO 捕捉为特殊情况。
  • 将带约束的经验问题化简为鞍点形式,使用拉格朗日乘子和无遗憾优化框架。
  • 对 lambda-玩家使用指数梯度(Exponential Weights)算法,对 h-玩家使用最佳应答的成本敏感分类器。
  • 将 h-玩家的最佳应答表达为一个带有当前乘子构造成本的成本敏感分类问题。
  • 提供有限样本保证,将子最优性、通过 Rademacher 复杂度衡量的统计误差与公平性约束违反联系起来。
  • 在需要时,提供对乘子进行网格搜索以获得确定性分类器的指导。

实验结果

研究问题

  • RQ1在不限制分类器族的前提下,如何在正式的公平性约束(如 DP 和 EO)下进行二元分类?
  • RQ2是否可以在归约框架中重复使用黑箱分类器以在公平约束下达到最低的经验误差?
  • RQ3在求解简化后的成本敏感问题时,准确性和公平性的有限样本保证是什么?
  • RQ4如何通过拉格朗日乘子将公平性约束有效地纳入成本敏感学习?
  • RQ5在实现准确性与公平性权衡时,使用随机化分类器与确定性分类器的影响是什么?

主要发现

  • 一系列成本敏感分类问题可以在公平性约束下实现最低的经验误差。
  • 对 lambda-玩家采用带 Exponential Gradient 的鞍点算法,在子线性子最优性下实现 nu-近似鞍点。
  • 该方法涵盖了可以表达为条件矩的线性不等式形式的多种公平性定义,包括 DP 和 EO。
  • 理论保证将统计误差(通过 Rademacher 复杂度)和优化误差与最终分类器性能联系起来。
  • 示例显示在该框架下,DP 和 EO 如何导致特定的成本构造和迭代界。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。