QUICK REVIEW

[论文解读] Manipulation-Proof Machine Learning

Daniel Björkegren|arXiv (Cornell University)|Jan 1, 2020

Experimental Behavioral Economics Studies被引用 1

一句话总结

本文提出了一种策略鲁棒的机器学习估计器，能够考虑当决策规则透明时个体对行为的策略性操纵。通过显式建模操纵成本并推导出在均衡中稳定的决策规则，该方法在肯尼亚实地实验中比标准监督学习提高了13%的性能，将透明度带来的性能损失从23%降低至仅8%。

ABSTRACT

An increasing number of decisions are guided by machine learning algorithms. In many settings, from consumer credit to criminal justice, those decisions are made by applying an estimator to data on an individual's observed behavior. But when consequential decisions are encoded in rules, individuals may strategically alter their behavior to achieve desired outcomes. This paper develops a new class of estimator that is stable under manipulation, even when the decision rule is fully transparent. We explicitly model the costs of manipulating different behaviors, and identify decision rules that are stable in equilibrium. Through a large field experiment in Kenya, we show that decision rules estimated with our strategy-robust method outperform those based on standard supervised learning approaches.

研究动机与目标

解决标准机器学习估计器在个体为迎合透明决策规则而策略性改变行为时失效的问题。
开发一种决策规则估计框架，能够预见并稳定在策略性操纵之下，即使规则完全透明。
量化算法透明度的性能成本，并证明通过策略建模可显著降低该成本。
通过在东非肯尼亚低收入智能手机用户中开展的实地实验，检验理论框架在现实场景中的适用性。
提供一个结构化模型，将决策规则分解为可操纵的组成部分，并实证估计其操纵成本。

提出的方法

形式化一个博弈论模型，其中个体选择行为以最大化期望结果，同时考虑操纵成本。
推导出一种策略鲁棒估计器，求解在策略行为下处于纳什均衡的稳定决策规则。
使用结构化模型，基于观测到的行为变化和专家访谈，估计操纵成本 αkj。
采用蒙特卡洛模拟，检验在已知和误设操纵成本下策略鲁棒估计器的稳健性。
通过基于智能手机的实地实验，收集操纵成本数据，并在真实数字信贷场景中验证估计器。
采用简化形式方法估计行为变化量（∆jj），并通过校准函数将其与结构化成本参数关联。

实验结果

研究问题

RQ1当决策规则透明时，策略性操纵如何降低标准机器学习估计器的性能？
RQ2能否设计一种机器学习估计器，使其在决策规则完全透明的情况下仍能保持稳定？
RQ3在撒哈拉以南非洲等低收入、数字新兴背景下，个体的操纵成本实际是多少？
RQ4当个体知晓评分规则时，与标准估计器相比，策略鲁棒估计器的性能如何？
RQ5当显式建模操纵行为时，透明度的真实成本——以预测性能损失衡量——是多少？

主要发现

在肯尼亚实地实验中，当个体知晓评分规则时，策略鲁棒估计器在平均性能上比标准监督学习模型高出13%。
使用策略鲁棒估计器后，透明度导致的性能损失从23%（在朴素规则下）降低至仅8%。
即使在肯尼亚低收入、近期采用智能手机的用户中，个体仍会策略性地改变行为以操纵算法决策，表明策略意识广泛存在。
专家访谈获得的操纵成本估计值与实验中的行为变化高度相关，验证了结构化模型的预测能力。
蒙特卡洛模拟表明，该方法对操纵成本的误设具有鲁棒性。
该框架能够将决策规则分解为可操纵的组成部分，并量化其策略性响应，为更稳健的算法设计提供了路径。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。