Skip to main content
QUICK REVIEW

[论文解读] Ridge Estimation of High Dimensional Two-Way Fixed Effect Regression

Junnan He, Jean-Marc Robin|arXiv (Cornell University)|Jan 7, 2026
Spatial and Panel Data Analysis被引用 0
一句话总结

论文为高维双向固定效应模型在稀疏双分网络下开发岭回归估计,推导Degree-Corrected SBM下偏差与方差的确定等量,且通过仿真和基于工资的雇主-雇员应用进行验证。

ABSTRACT

We study a ridge estimator for the high-dimensional two-way fixed effect regression model with a sparse bipartite network. We develop concentration inequalities showing that when the ridge parameters increase as the log of the network size, the bias, and the variance-covariance matrix of the vector of estimated fixed effects converge to deterministic equivalents that depend only on the expected network. We provide simulations and an application using administrative data on wages for worker-firm matches.

研究动机与目标

  • 在传统OLS识别弱的情况下,动机在高维、稀疏双分网络中对双向固定效应进行估计。
  • 开发岭回归框架,对工人和企业固定效应分别进行正则化,以获得稳定的估计。
  • 在网络的Degree-Corrected SBM模型下推导岭估计量的偏差和方差的确定等价式。
  • 通过仿真显示岭正则化相对于OLS在固定效应分布恢复方面的改进。
  • 通过对工人-企业匹配(DADS面板)工资的实证应用,展示方法的相关性。

提出的方法

  • 定义双向固定效应模型 y_ijs = μ_i + φ_j + u_ijs,匹配的稀疏双分图。
  • 引入对工人和企业分别施加λ_w和λ_f的岭估计量,并给出估计量的分块逆形式。
  • 构建正则化拉普拉斯矩阵和归一化邻接矩阵,以确保在正则化(λ_w, λ_f > 0)下可行且特征值为正。
  • 为工人和企业建立一个随机块模型(Degree-Corrected SBM),以捕捉社区结构和网络稀疏性。
  • 推导集中化结果,表明当惩罚项按log(n+p)缩放时,偏差和方差收敛到基于预期网络的确定等价式。
  • 提供蒙特卡洛仿真和实证工资分解应用以说明性能。

实验结果

研究问题

  • RQ1在稀疏双分网络下,高维双向固定效应的岭估计量的渐进行为是什么?
  • RQ2当惩罚项随网络规模的对数增长时,岭估计量的偏差和方差如何表现?
  • RQ3基于预期网络的确定等价式能否准确刻画估计的固定效应分布?
  • RQ4在稀疏网络中,岭正则化是否相对于OLS提高固定效应分布和方差分解的恢复?
  • RQ5这些方法在来自工人-企业匹配的真实工资数据(DADS面板)上的表现如何?

主要发现

  • 以对数(n+p)阶尺度增长的岭惩罚使偏差和方差收敛到仅取决于预期网络的确定等价式。
  • 在正性惩罚下,岭估计量可行,正则化拉普拉斯矩阵的特征值有下界,避免奇异。
  • 蒙特卡洛实验表明岭正则化相对于OLS在固定效应分布的恢复方面有显著改进。
  • 在非常稀疏的网络中,工资对数方差分解受惠于岭正则化,而同方差偏差修正在此情形下无效。
  • 对法国工资数据(DADS面板)的经验应用给出更合理的工人/企业方差份额和相比OLS分解的正向协方差贡献。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。