[论文解读] ppmlhdfe: Fast Poisson Estimation with High-Dimensional Fixed Effects
ppmlhdfe 提供一个快速的 Stata 实现,用于带有多高维固定效应的泊松回归,采用优化的 IRLS 算法和鲁棒的 MLE 存在性检查。它建立在 reghdfe 的基础上,以实现高维估计的高效性。
In this paper we present ppmlhdfe, a new Stata command for estimation of (pseudo) Poisson regression models with multiple high-dimensional fixed effects (HDFE). Estimation is implemented using a modified version of the iteratively reweighted least-squares (IRLS) algorithm that allows for fast estimation in the presence of HDFE. Because the code is built around the reghdfe package, it has similar syntax, supports many of the same functionalities, and benefits from reghdfe's fast convergence properties for computing high-dimensional least squares problems. Performance is further enhanced by some new techniques we introduce for accelerating HDFE-IRLS estimation specifically. ppmlhdfe also implements a novel and more robust approach to check for the existence of (pseudo) maximum likelihood estimates.
研究动机与目标
- 将泊松伪最大似然(PPML)作为对非负因变量数据且含有大量零值的鲁棒替代方法进行动机说明。
- 将 PPML 扩展到具有高维固定效应(HDFE)的情形。
- 利用并调整 reghdfe 框架,以实现带有 HDFE 的快速非线性泊松估计。
- 引入鲁棒程序以在具有 HDFE 的 PPML 中验证最大似然估计存在性。
提出的方法
- 使用改进的迭代重加权最小二乘法(IRLS)算法进行 PPML 估计。
- 应用 within-transformation(FWL)以吸收高维固定效应并降低估计问题的维数。
- 嵌入 reghdfe 的 Mata 例程以加速 HDFE 计算并减少对底层 HDFE 求解器的调用次数。
- 引入渐进式 within-transformation 与自适应内循环收敛标准以加速计算。
- 结合检测并处理分离观测的办法,以确保 MLE 存在性。
实验结果
研究问题
- RQ1在存在多个高维固定效应时,如何高效地估计 PPML?
- RQ2带有 within-transformation 的 IRLS 能否被加速以有效处理 HDFE 非线性模型?
- RQ3在高维固定效应背景下,如何对 PPML 的 MLE 存在性进行鲁棒地验证?
- RQ4相对于现有的非线性 HDFE 方法,实际性能提升有哪些?
- RQ5与其他 PPML/GLM 工具相比,ppmlhdfe 在收敛性和鲁棒性方面表现如何?
主要发现
- ppmlhdfe 通过逐步对 X 和 z 进行 within-transform,并在 IRLS 迭代中重复使用变换,显著提升了速度。
- 该方法减少了对 HDFE 求解器的调用次数,通常使调用次数减少 50% 及以上,从而实现更快的收敛。
- ppmlhdfe 能鲁棒地检测分离观测并剔除有问题的观测,以确保有效的 MLE 存在性。
- 该方法在固定效应设置下得到与 PPML 一致的结果,并能在吸收固定效应后再现标准的 PPML 输出。
- 示例表明对分离具有鲁棒性,且能够吸收包括交互项和异质斜率在内的多重固定效应。
- 该命令与因子固定效应兼容,支持多向聚类和各种 VCE 选项。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。