[论文解读] Fairness in Machine Learning: Lessons from Political Philosophy
本文综述歧视与平等主义的哲学理论,以澄清在机器学习中“公平”的含义,并指引在不同情境下应采用哪些公平度量和方法。
What does it mean for a machine learning model to be `fair', in terms which can be operationalised? Should fairness consist of ensuring everyone has an equal probability of obtaining some benefit, or should we aim instead to minimise the harms to the least advantaged? Can the relevant ideal be determined by reference to some alternative state of affairs in which a particular social pattern of discrimination does not exist? Various definitions proposed in recent literature make different assumptions about what terms like discrimination and fairness mean and how they can be defined in mathematical terms. Questions of discrimination, egalitarianism and justice are of significant interest to moral and political philosophers, who have expended significant efforts in formalising and defending these central concepts. It is therefore unsurprising that attempts to formalise `fairness' in machine learning contain echoes of these old philosophical debates. This paper draws on existing work in moral and political philosophy in order to elucidate emerging debates about fair machine learning.
研究动机与目标
- 澄清哲学概念中的歧视如何映射到机器学习的公平性关注点。
- 探索不同的平等主义框架如何影响在ML中选择和优先考虑的公平性度量。
- 强调应影响ML系统公平性干预的情境和历史因素。
提出的方法
- 调查并综合关键歧视哲学理论(心理状态 vs. 非心理状态观)。
- 回顾平等主义辩论(平等主义的“货币”、正义领域、运气 vs. 应得、义务正义)。
- 将哲学分析与常见ML公平性度量联系起来(人口统计均衡、准确性平等、机会平等、不同对待)。
- 讨论历史、社会学和情境因素应如何影响特征选择与公平干预。
实验结果
研究问题
- RQ1在算法决策中,什么算作歧视?何时具有道德上的问题?
- RQ2不同的平等主义理论如何转化为公平ML的标准(如结果平等 vs 机会平等、运气平等考虑)?
- RQ3历史与社会学的情境应以何种方式影响ML中的公平性评估与缓解策略?
- RQ4表征性伤害与分配性伤害在ML公平性中的相关性如何?
主要发现
- 来自哲学的歧视观念(心理状态和基于泛化的观点)对算法的直接适用性有限,提示需要替代的公平基础。
- 平等主义理论提供更丰富的框架(平等主义的货币、正义领域、运气与应得、义务正义)来证明和优先ML中的公平干预。
- ML中的公平性常涉及相互冲突的度量之间的权衡(如准确性平等与等化假阳性率),通过义务正义和历史考量能更好理解。
- 表征性伤害(如偏见的文化表征)需要与分配性伤害不同的公平目标,对ML系统带来独特挑战。
- 情境因素(如正义领域和历史不公)应指导在特定情境下应采用哪些公平度量和减缓措施。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。