[论文解读] What's Logs Got to do With it: On the Perils of log Dependent Variables and Difference-in-Differences
本论文表明,在差分中的差分(DD)设计中对因变量进行对数变换可能导致与水平设定相比,DD估计量的符号出现差异,尤其当基线结果分布在各组之间不同时;它给出一个何时发生符号反转的条件,并通过仿真和两个实证案例研究来证明。
The log transformation of the dependent variable is not innocuous when using a difference-in-differences (DD) model. With a dependent variable in logs, the DD term captures an approximation of the proportional difference in growth rates across groups. As I show with both simulations and two empirical examples, if the baseline outcome distributions are sufficiently different across groups, the DD parameter for a log-specification can be different in sign to that of a levels-specification. I provide a condition, based on (i) the aggregate time effect, and (ii) the difference in relative baseline outcome means, for when the sign-switch will occur.
研究动机与目标
- 突出功能形态(水平与对数)如何影响DD估计。
- 推导当基线分布不同时时DD符号发生反转的条件。
- 通过仿真实验演示符号反转现象。
- 给出两个实证案例,在水平与对数设定下呈现相反符号的DD估计。
提出的方法
- 给出一个包含水平与对数变换结果的DD框架;推导DD参数与增长差异之间的关系(Equations 3–7)。
- 提出Proposition 1,给出基于总体时间效应和基线结果差异的符号反转条件。
- 进行仿真以验证符号反转并说明情景。
- 给出两个实证案例(大萧条时期的收入、伦敦房价在英国脱欧周围)在相同数据和控制下呈现水平与对数设定下相反符号的DD。
实验结果
研究问题
- RQ1在水平与对数设定下,DD估计量的符号何时会不同?
- RQ2基线结果分布差异和总体时间效应如何驱动DD估计中的符号变化?
- RQ3实证示例在使用水平与对数结果时是否呈现相反符号的DD估计?
主要发现
- 在DD中对数设定近似增长率的比例差异,而非水平变化(Equations 4–7)。
- 当基线结果分布差异足够大且存在非零的总体时间效应时,水平与对数DD估计之间可能出现符号反转(Proposition 1)。
- 仿真显示在固定时间效应的情况下,改变基线差异可在2x2 DD单元中产生跨设定的相反符号DD估计。
- 两个实证案例(按种族划分的大萧条时期收入;伦敦内外区房价在英国脱欧周围)在相同数据和控制下,水平与对数设定下呈现相反符号的DD估计。
- 符号反转取决于基线差异与总体时间效应之比,具体不等式中给出。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。