[论文解读] Orthogonal Machine Learning for Demand Estimation: High Dimensional Causal Inference in Dynamic Panels
本文将双重机器学习(Double Machine Learning)扩展至高维和动态面板设置,即使处理变量数量随样本量增长,也能实现根N收敛和因果需求价格弹性的有效推断。该研究提出正交化LASSO估计量,实现类oracle性能,使双重ML成为非契约性、高维需求估计中因果推断的稳健工具。
There has been growing interest in how economists can import machine learning tools designed for prediction to facilitate, optimize and automate the model selection process, while still retaining desirable inference properties for causal parameters. Focusing on partially linear models, we extend the Double ML framework to allow for (1) a number of treatments that may grow with the sample size and (2) the analysis of panel data under sequentially exogenous errors. Our low-dimensional treatment (LD) regime directly extends the work in Chernozhukov et al. (2016), by showing that the coefficients from a second stage, ordinary least squares estimator attain root-n convergence and desired coverage even if the dimensionality of treatment is allowed to grow at a rate of O(N/ log N ). Additionally we consider a high-dimensional sparse (HDS) regime in which we show that second stage orthogonal LASSO and debiased orthogonal LASSO have asymptotic properties equivalent to oracle estimators with known first stage estimators. We argue that these advances make Double ML methods a desirable alternative for practitioners estimating short-term demand elasticities in non-contractual settings.
研究动机与目标
- 解决在多重处理和动态面板结构下高维需求估计中的因果推断挑战。
- 将双重ML框架扩展至允许处理数量相对于样本量增长,同时保持根N收敛。
- 开发正交化LASSO方法,在高维稀疏条件下实现与oracle估计量相当的渐近性质。
- 利用具有因果保证的机器学习工具,在非契约性市场环境中实现短期需求价格弹性有效推断。
- 为具有高维处理效应的动态面板数据提供理论基础坚实且可扩展的因果推断方法。
提出的方法
- 将双重ML框架适配至具有顺序外生误差的面板数据,确保在弱依赖假设下的有效推断。
- 引入低维处理(LD)情形,其中处理数量以O(N / log N)的速率增长,同时保持第二阶段OLS估计量的根N收敛。
- 在高维稀疏(HDS)情形下提出正交化LASSO和去偏正交化LASSO估计量,校正第一阶段估计偏差。
- 使用Neyman正交 estimating equations,确保对第一阶段干扰参数估计误差的鲁棒性。
- 采用双重/去偏估计方法,将处理效应估计与条件均值的非参数估计解耦。
- 将该框架应用于部分线性模型,实现高维处理向量和动态依赖关系下因果效应的估计。
实验结果
研究问题
- RQ1双重ML能否在具有顺序外生误差的面板数据中扩展,同时保持因果参数的有效推断?
- RQ2当处理数量随样本量增长时,根N收敛和渐近正态性在何种条件下成立?
- RQ3在具有内生处理效应的高维稀疏模型中,正交化LASSO估计量如何实现类oracle性能?
- RQ4在高维处理设定下,所提出方法在有限样本中在覆盖性和大小性质方面表现如何?
- RQ5双重ML能否在实践中应用于非契约性、高维市场环境中估计短期需求价格弹性?
主要发现
- 在低维处理情形下,即使处理数量以O(N / log N)的速率增长,仍能实现根N收敛和有效推断。
- 在高维稀疏情形下,正交化LASSO估计量达到与已知第一阶段估计量的oracle估计量相当的渐近性质。
- 去偏正交化LASSO在高维稀疏和弱依赖条件下实现渐近正态性及有效置信区间。
- 所提出的框架在顺序外生性假设下,即使处理维度不断增长,也能在有限样本中保持正确的覆盖性和大小性质。
- 该方法为动态面板数据中高维处理效应的短期需求价格弹性估计提供了可扩展且理论基础坚实的替代方案。
- 将双重ML扩展至具有顺序外生误差的面板数据,保持了双重稳健性特性,增强了实证应用中的可靠性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。