[论文解读] Fairness Constraints: Mechanisms for Fair Classification
本文提出了一种针对凸边际分类器(如逻辑回归和SVM)的新型公平性约束机制,利用可计算的基于协方差的决策边界公平性度量,同时防止差别性对待与差别性影响。该方法实现了公平性与准确率之间的细粒度权衡,在保持高模型性能的同时,符合80%规则和业务必要性条款。
Algorithmic decision making systems are ubiquitous across a wide variety of online as well as offline services. These systems rely on complex learning methods and vast amounts of data to optimize the service functionality, satisfaction of the end user and profitability. However, there is a growing concern that these automated decisions can lead, even in the absence of intent, to a lack of fairness, i.e., their outcomes can disproportionately hurt (or, benefit) particular groups of people sharing one or more sensitive attributes (e.g., race, sex). In this paper, we introduce a flexible mechanism to design fair classifiers by leveraging a novel intuitive measure of decision boundary (un)fairness. We instantiate this mechanism with two well-known classifiers, logistic regression and support vector machines, and show on real-world data that our mechanism allows for a fine-grained control on the degree of fairness, often at a small cost in terms of accuracy.
研究动机与目标
- 解决在自动化决策系统中设计公平分类器的挑战,避免差别性对待与差别性影响。
- 在数据驱动学习环境中,实现对反歧视法律的合规,特别是80%规则和业务必要性条款。
- 开发一种灵活、凸性且可扩展的机制,可无缝集成到现有凸边际分类器中,且不增加计算复杂度。
- 提供一种清晰的公平性与准确率之间的权衡机制,适用于多个敏感属性。
- 在推理阶段不使用敏感属性信息,从而避免差别性对待。
提出的方法
- 提出一种基于敏感属性与特征向量到分类器决策边界的有符号距离之间协方差的新公平性度量。
- 将此协方差用作80%规则的代理指标,实现在公平分类器训练中的可计算优化。
- 提出两种互补的公式化方法:一种是在公平性约束下最大化准确率(用于符合非歧视政策),另一种是在准确率约束下最大化公平性(用于符合业务必要性条款)。
- 将公平性约束作为凸惩罚项整合到逻辑回归和SVM的优化中,保持其原始计算复杂度。
- 在公平性最大化公式中采用两阶段训练策略,以保留未受保护个体在无约束模型中的预测结果。
- 对初始协方差应用阈值化机制,以动态调整不同敏感属性的公平性水平。
实验结果
研究问题
- RQ1如何在推理过程中不使用敏感属性信息的情况下强制实现分类公平性,从而避免差别性对待?
- RQ2能否推导出一种凸且可计算的决策边界公平性度量,有效代理差别性影响的80%规则?
- RQ3如何将反歧视法律中的业务必要性条款正式整合到公平学习框架中?
- RQ4在凸边际分类器中,公平性在多大程度上可以独立于准确率进行控制?
- RQ5所提出方法在多个敏感属性和真实世界数据集上的表现如何?
主要发现
- 所提出的公平性机制允许对公平性水平进行细粒度控制,在真实世界数据集中通常仅导致适度的准确率损失。
- 随着协方差阈值降低,正类中受保护与非受保护个体的比例逐渐趋于平衡,接近符合80%规则的公平性水平。
- 该方法在测试阶段不使用敏感属性信息的情况下实现了对80%规则的合规,从而避免了差别性对待。
- 采用细粒度约束的公平性最大化公式相比标准公平性约束,能为非受保护个体保留更多正向预测,尽管准确率略有下降。
- 即使在敏感属性值稀疏的情况下(如“其他”种族),该框架依然有效,但对代表性不足群体的公平性估计准确性较低。
- 该方法在灵活性方面优于现有最先进方法,支持多个敏感属性以及公平性-准确率权衡的两种模式。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。