[论文解读] Learning Non-Discriminatory Predictors
本文分析满足保护属性的相等化机会的学习预测器,展示事后修正可能并非最优,证明两步学习方法的统计最优性,但在没有松弛时计算困难;随后提出第二矩松弛(等价相关性)以实现可处理的学习。
We consider learning a predictor which is non-discriminatory with respect to a "protected attribute" according to the notion of "equalized odds" proposed by Hardt et al. [2016]. We study the problem of learning such a non-discriminatory predictor from a finite training set, both statistically and computationally. We show that a post-hoc correction approach, as suggested by Hardt et al, can be highly suboptimal, present a nearly-optimal statistical procedure, argue that the associated computational problem is intractable, and suggest a second moment relaxation of the non-discrimination definition for which learning is tractable.
研究动机与目标
- 以相等化赔率为基础,针对受保护属性 A 对监督学习中的非歧视进行动机化和形式化。
- 展示事后修正方法实现非歧视的局限性。
- 开发一个统计最优的学习框架,以从有限样本中产生非歧视的预测器。
- 证明学习严格的非歧视二进制预测器在计算上不可行,并识别可行的松弛。
提出的方法
- 定义相等化赔率并将其与二元设定中的分组条件真实/假阳性率联系起来。
- 在0-1、铰链损失和平方损失,以及受限的假设类下,证明事后修正的次优性。
- 提出一个两步学习框架:第一步在带有近似非歧视约束的经验风险最小化器上进行训练;第二步进行训练后修正以导出非歧视预测器。
- 为两步框架提供统计保证:在有限样本上的损失和歧视的保证;第二步中消除对假设类的依赖。
实验结果
研究问题
- RQ1事后修正相对于真正的非歧视预测器在常见损失和假设类下的表现如何?
- RQ2在相等化赔率下,有限样本学习过程是否能够在强制近似非歧视的同时实现接近最优的准确性?
- RQ3学习一个非歧视的二元预测器在计算上是否可行?若不可行,哪些松弛可以实现可处理的学习?
- RQ4首先强制近似非歧视,随后修正预测器的两步框架的统计保证有哪些?
- RQ5在高斯假设下,第二矩松弛(等价相关性)与相等化赔率在歧视和学习性能上有何比较?
主要发现
- 在受歧视约束下,事后修正对于0-1、铰链,乃至平方损失都可能非常次优。
- 从有限数据学习非歧视预测器需要将非歧视并入学习过程,而不仅仅是后处理。
- 一个两步学习程序在有限样本保证下可实现接近最优的损失和受控的歧视,但对精确的非歧视二元预测器计算上是困难的。
- 放宽到第二矩条件(等价相关性)使得对凸损失和线性预测器的学习变得可处理,并且在平方损失的高斯假设下等价于相等化赔率。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。