Skip to main content
QUICK REVIEW

[论文解读] Wasserstein Fair Classification

Ray Jiang, Aldo Pacchiano|arXiv (Cornell University)|Jul 28, 2019
Ethics and Social Impacts of AI参考文献 44被引用 38
一句话总结

提出一种通过强制模型输出与敏感属性独立性来实现公平分类的方法,使用指向质心的Wasserstein-1距离,结合带惩罚的逻辑回归和快速后处理变体,在公平性基准上显示经验提升。

ABSTRACT

We propose an approach to fair classification that enforces independence between the classifier outputs and sensitive information by minimizing Wasserstein-1 distances. The approach has desirable theoretical properties and is robust to specific choices of the threshold used to obtain class predictions from model outputs. We introduce different methods that enable hiding sensitive information at test time or have a simple and fast implementation. We show empirical performance against different fairness baselines on several benchmark fairness datasets.

研究动机与目标

  • 激励在分类中追求公平性的需求,以及基于阈值的独立性局限性。
  • 引入一个基于模型输出S与敏感属性A独立性的公平性标准(SDP)。
  • 将Wasserstein-1距离到质心形式化为实现SDP的基于最优传输的机制。
  • 提供两种实用方法(带惩罚的逻辑回归和后处理)来在实践中执行SDP。
  • 展示在基准数据集上相对于公平性基线的经验改进。

提出的方法

  • 将信念变量S定义为在给定A和X的条件下Y=1的概率。
  • 提出SDP,要求所有敏感组a的p_Sa等于p_Sbar,通过Wasserstein-1质心p_Sbar。
  • 证明实现SDP的最优后处理是用W1将各组分布p_Sa运输到p_Sbar,最小化期望的类别变化。
  • 开发一个Wasserstein-1带惩罚的逻辑回归目标函数,在标准逻辑损失基础上加入组分布与质心之间的W1项(带权重和测试时变体)。
  • 提供一个在人口统计上盲目的变体,在测试时不将敏感属性包含在特征中,但用于计算W1惩罚。
  • 提供一个基于近似W1传输(分位数匹配)的更简单的后处理方法。

实验结果

研究问题

  • RQ1如何在固定阈值之外强制分类输出与敏感属性之间的独立性?
  • RQ2到质心的Wasserstein-1距离(SDP)在尽量减少预测改变的同时实现公平性方面是否最优?
  • RQ3实用、可扩展的方法(带惩罚的逻辑回归和后处理)能否在尽量少损失预测效用的情况下实现强的人口统计平等?
  • RQ4基于Wasserstein的公平性方法在基准数据集上的经验表现如何,相对于标准基线?

主要发现

  • Wasserstein-1质心传输通过使各组输出分布对齐、对原始预测的变化最小化来实现SDP。
  • 最优性:将所有组分布运输到W1质心可使总期望类别预测变化最小。
  • 一个在人口统计上盲目的测试时变体在部署时不需要敏感属性仍然有效。
  • 两种实用实现(带惩罚的逻辑回归和后处理)在基准数据集上优于若干公平性基线。
  • 对多个数据集(如Adult、German、Bank Marketing、Community & Crime)的经验结果显示该方法在公平性指标方面具有竞争力。
  • 该方法同时提供严格的后处理选项和训练时惩罚方法,为部署场景提供灵活性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。