[论文解读] On the relation between accuracy and fairness in binary classification
本文揭示了在二分类中评估公平性-准确率权衡时的一个关键缺陷:在未考虑不同正向预测率(接受率)的情况下比较分类器,会导致误导性结论。本文提出通过在每个接受率下以基线性能对准确率和歧视性指标进行归一化,表明标准比较可能掩盖即使名义公平性提升时仍被放大的歧视现象。
Our study revisits the problem of accuracy-fairness tradeoff in binary classification. We argue that comparison of non-discriminatory classifiers needs to account for different rates of positive predictions, otherwise conclusions about performance may be misleading, because accuracy and discrimination of naive baselines on the same dataset vary with different rates of positive predictions. We provide methodological recommendations for sound comparison of non-discriminatory classifiers, and present a brief theoretical and empirical analysis of tradeoffs between accuracy and non-discrimination.
研究动机与目标
- 揭示由于正向预测率不同,导致在非歧视性分类器之间进行性能比较时存在误导风险。
- 主张标准准确率和歧视性指标在不同接受率的分类器之间不可比较。
- 提出归一化指标(κ 表示准确率,δ 表示歧视性),以考虑每个接受率下的基线表现。
- 证明在有偏数据上训练的分类器可能放大潜在歧视,即使名义公平性有所改善。
- 倡导在评估公平意识机器学习模型时采用方法严谨的率调整性能度量。
提出的方法
- 通过将分类器性能与相同接受率 π 下的随机基线进行比较,对准确率进行归一化。
- 引入归一化歧视性度量 δ = d / d_max(π),其中 d_max(π) 是在接受率 π 下可能的最大歧视。
- 使用理论上的歧视上限,即当所有有利群体成员均在任何受保护群体成员之前被接受时的情形。
- 在 UCI Adult 数据集上使用逻辑回归、朴素贝叶斯和决策树,在不同阈值下评估性能。
- 采用“调校”技术调整训练标签,强制实现零歧视,同时保持原始接受率。
- 在多个接受率下,对使用和不使用受保护属性、以及使用和不使用数据预处理的分类器进行实证比较。
实验结果
研究问题
- RQ1接受率的变化在多大程度上影响非歧视性分类器之间准确率与公平性指标的可比性?
- RQ2为何当分类器具有不同正向预测率时,标准的准确率与歧视性比较可能具有误导性?
- RQ3在给定接受率下,理论上可能的最大歧视是多少?如何利用它对公平性指标进行归一化?
- RQ4当接受率不同时,标准公平性技术(如数据重加权或属性移除)在在多大程度上真正减少了潜在歧视?
- RQ5与原始指标相比,归一化指标(κ 和 δ)在多大程度上提升了公平性-准确率比较的有效性?
主要发现
- 接受率低于原始数据的分类器通常显示名义歧视性(d)改善,但归一化歧视性(δ)显著变差,表明实际公平性更差。
- 在训练中使用受保护属性会使归一化歧视性(δ)超过原始数据,即使名义歧视性(d)下降。
- 移除受保护属性无法消除因特征相关性导致的间接歧视(红线效应),导致 δ 高于原始数据。
- “调校”技术可使接受率更接近原始数据并降低名义歧视性(d),但可能导致过度调整或引入反向歧视。
- 归一化指标(κ 和 δ)揭示,某些分类器在公平性方面实际上比原始数据更差,即使在原始指标上表现更优。
- 当分类器的接受率(π)不同时,使用原始准确率(A)和歧视性(d)进行性能比较是无效的;归一化指标对于有效评估至关重要。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。