[论文解读] Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment
本文提出了‘差异性误伤’——一种基于敏感群体间误分类率不均等的公平性概念——并提出了一种凸-凹优化框架,用于训练能最小化此类差异的分类器。该方法在几乎不损失准确率的情况下有效减少了差异性误伤,在合成数据集和真实世界数据集(包括COMPAS)上均优于基线方法。
Automated data-driven decision making systems are increasingly being used to assist, or even replace humans in many settings. These systems function by learning from historical decisions, often taken by humans. In order to maximize the utility of these systems (or, classifiers), their training involves minimizing the errors (or, misclassifications) over the given historical data. However, it is quite possible that the optimally trained classifier makes decisions for people belonging to different social groups with different misclassification rates (e.g., misclassification rates for females are higher than for males), thereby placing these groups at an unfair disadvantage. To account for and avoid such unfairness, in this paper, we introduce a new notion of unfairness, disparate mistreatment, which is defined in terms of misclassification rates. We then propose intuitive measures of disparate mistreatment for decision boundary-based classifiers, which can be easily incorporated into their formulation as convex-concave constraints. Experiments on synthetic as well as real world datasets show that our methodology is effective at avoiding disparate mistreatment, often at a small cost in terms of accuracy.
研究动机与目标
- 在存在真实标签的情况下解决机器学习中的公平性问题,超越对差异性对待和影响的考量。
- 定义并形式化‘差异性误伤’,即敏感群体间误分类率的不平等。
- 开发一种实用且可扩展的方法,训练分类器以避免差异性误伤,同时保持高准确率。
- 实现在不直接使用敏感属性的情况下,同时缓解差异性误伤与差异性对待。
提出的方法
- 提出一种新的公平性概念——差异性误伤,定义为敏感群体间假阳性率、假阴性率、假发现率或假排除率的不平等。
- 将误分类率差异的公平性约束形式化为凸-凹优化问题。
- 使用误分类协方差的蒙特卡洛近似方法,高效估计公平性约束。
- 通过严格凸-凹规划(DCCP)将公平性约束整合到线性与非线性分类器(如逻辑回归)中。
- 利用凸-凹规划求解器,实现准确率与公平性的联合优化。
- 通过针对特定误分类类型(如假阳性或假阴性)进行控制,实现灵活的公平性调控,以适应具体应用场景。
实验结果
研究问题
- RQ1能否在分类系统中有效形式化并优化基于误分类率的公平性准则——即差异性误伤?
- RQ2如何在不牺牲准确率的前提下,将差异性误伤作为凸-凹约束融入分类器训练?
- RQ3与现有方法相比,该方法在保持或提升模型效用的同时,能在多大程度上减少差异性误伤?
- RQ4当推理过程中不直接使用敏感属性(如反歧视法律所要求)时,该方法是否仍具有效性?
主要发现
- 所提出的方法在合成数据集和真实世界数据集上,有效降低了假阳性和假阴性率的差异性误伤,且准确率损失极小。
- 在COMPAS数据集上,该方法将假阳性率差异(DFPR)降低至0.06,假阴性率差异(DFNR)降低至-0.14,优于基线方法及Hardt等人的方法,在公平性-准确率权衡上表现更优。
- 对假阳性率的约束控制也减少了假阴性率的差异性误伤,反之亦然,表明不同误分类类型之间存在强烈依赖关系。
- 在所有情况下,该方法并未实现零差异(例如DFPR或DFNR = 0),可能由于数据集规模较小,导致协方差估计不准确。
- Hardt等人的方法虽实现了零DFPR和DFNR,但付出了显著的准确率代价(例如在COMPAS数据集上准确率仅为64.5%),凸显了公平性与效用之间的权衡。
- 在小样本数据集上性能下降,原因在于协方差估计不可靠,表明该方法在更大训练集上能获得更稳健的公平性约束。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。