Skip to main content
QUICK REVIEW

[论文解读] Machine Learning Estimation of Heterogeneous Treatment Effects with Instruments

Vasilis Syrgkanis, Victor Lei|arXiv (Cornell University)|May 24, 2019
Advanced Causal Inference Techniques参考文献 21被引用 31
一句话总结

本文提出了一种机器学习框架,用于在存在未观测混杂因素的情况下,利用工具变量(IVs)估计异质处理效应。通过将问题简化为包含辅助模型的损失函数最小化,该方法能够使用现代机器学习算法(例如神经网络、随机森林),并确保对扰动模型估计误差的鲁棒性,从而获得渐近正态的估计结果及有效的置信区间。

ABSTRACT

We consider the estimation of heterogeneous treatment effects with arbitrary machine learning methods in the presence of unobserved confounders with the aid of a valid instrument. Such settings arise in A/B tests with an intent-to-treat structure, where the experimenter randomizes over which user will receive a recommendation to take an action, and we are interested in the effect of the downstream action. We develop a statistical learning approach to the estimation of heterogeneous effects, reducing the problem to the minimization of an appropriate loss function that depends on a set of auxiliary models (each corresponding to a separate prediction task). The reduction enables the use of all recent algorithmic advances (e.g. neural nets, forests). We show that the estimated effect model is robust to estimation errors in the auxiliary models, by showing that the loss satisfies a Neyman orthogonality criterion. Our approach can be used to estimate projections of the true effect model on simpler hypothesis spaces. When these spaces are parametric, then the parameter estimates are asymptotically normal, which enables construction of confidence sets. We applied our method to estimate the effect of membership on downstream webpage engagement on TripAdvisor, using as an instrument an intent-to-treat A/B test among 4 million TripAdvisor users, where some users received an easier membership sign-up process. We also validate our method on synthetic data and on public datasets for the effects of schooling on income.

研究动机与目标

  • 解决由于非遵从性和未观测混杂因素导致处理分配内生时,估计异质处理效应的挑战。
  • 将现代机器学习方法(例如随机森林、神经网络)整合到工具变量回归中,以实现复杂、非参数化的效应建模。
  • 通过Neyman正交性确保效应估计对辅助扰动模型误差的鲁棒性。
  • 在将效应模型投影到参数模型时,实现渐近正态估计量并构建有效的置信区间。
  • 在真实世界数据(TripAdvisor)和合成/模拟数据集(NLSYM)上验证该方法,结果表明其覆盖概率更高且偏差更小。

提出的方法

  • 该方法将异质IV估计问题简化为在假设空间上对平方损失函数的最小化问题,采用类似双重机器学习的方法。
  • 提出一种依赖于结果、处理和工具变量辅助模型的损失函数,通过Neyman正交性确保对估计误差的鲁棒性。
  • 该方法允许使用任何黑箱机器学习算法来估计扰动函数(例如梯度提升、神经网络)。
  • 最终的效应模型通过两阶段过程进行估计:首先拟合扰动模型;其次通过最小化能去偏估计的损失函数来估计效应。
  • 当将效应模型投影到参数空间时,所得参数估计量渐近正态,从而可构建置信区间。
  • 该方法支持非参数和参数效应估计,并在均方误差率方面提供理论保证。

实验结果

研究问题

  • RQ1现代机器学习方法能否与工具变量回归有效结合,以估计异质处理效应?
  • RQ2如何控制辅助模型中的估计误差,以确保异质效应估计的鲁棒性?
  • RQ3当将效应模型投影到参数模型时,所提出的方法是否能产生有效的效应参数置信区间?
  • RQ4在有限样本中,该方法与现有方法(例如DMLATEIV、IV森林)相比,在偏差和覆盖概率方面表现如何?
  • RQ5在存在依从性异质性和未观测混杂因素的情境下,该方法能否恢复真实的处理效应?

主要发现

  • 在合成数据上,所提出的DRIV方法在100次蒙特卡洛模拟中实现了98%的置信区间覆盖,而DMLATEIV仅为52%,表明其在有限样本中表现更优。
  • 在半合成的NLSYM数据集中,DRIV在使用GBM时的ATE估计偏差为0.041,使用LM时为0.072,均低于DMLATEIV的0.157(GBM)和0.137(LM),且覆盖率分别为93%和98%。
  • 在涉及400万用户的现实世界TripAdvisor数据中,该方法估计出会员注册对网页参与度具有正向效应,利用意向治疗A/B测试作为工具变量。
  • 该方法成功识别出母亲教育程度较低的用户群体中处理效应最高,与文献中的先前发现一致。
  • 当将效应模型投影到线性模型时,母亲教育系数的置信区间在95%的情况下覆盖了真实值,证实了有效推断。
  • 该方法对扰动模型的模型误设表现出鲁棒性,均方误差率仅取决于效应模型假设空间的复杂度。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。