Skip to main content
QUICK REVIEW

[论文解读] Social Interactions Models with Latent Structures

Zhongjian Lin, Zhentao Shi|arXiv (Cornell University)|Feb 6, 2026
Mobile Crowdsensing and Crowdsourcing被引用 0
一句话总结

论文开发了一种将 NPL 与 Classifier-Lasso 相结合、并通过参数化自举去偏的方法,用于估计具有潜在分组结构的异质同行效应,并将其应用于 Add Health 数据,以揭示一个簇中的聚类和显著的同行效应。

ABSTRACT

This paper studies estimation and inference of heterogeneous peer effects featuring group fixed effects and slope heterogeneity under latent structure. We adapt the Classifier-Lasso algorithm to consistently discover latent structures and determine the number of clusters. To solve the incidental parameter problem in the binary choice model with social interactions, we propose a parametric bootstrap method to debias and establish its asymptotic validity. Monte Carlo simulations confirm strong finite sample performance of our methods. In an application to students' risky behaviors, the algorithm detects two latent clusters and finds that peer effects are significant within one of the clusters, demonstrating the practical applicability in uncovering heterogeneous social interactions.

研究动机与目标

  • 需要建模跨群体同行效应的异质性,而非假设同质性。
  • 提出一个带组固定效应和潜在聚类结构的二元选择社交互动模型。
  • 开发一个结合 NPL 与 C-Lasso 的两阶段估计策略,以识别潜在聚类和参数。
  • 提供基于自举的推断以去偏偶然参数效应并建立渐近有效性。
  • 以 Add Health 数据展示在簇内的同行效应,证明实际可行性。

提出的方法

  • 将带组固定效应和组特定斜率的二元选择社交互动模型进行公式化。
  • 使用 Nested Pseudo Likelihood (NPL) 算法估计共同斜率和固定效应。
  • 引入潜在结构扩展,其中组级斜率来自有限簇集合,并通过 Classifier-Lasso (C-Lasso) 识别簇。
  • 采用三步调整算法:首先运行 NPL,其次用 C-Lasso 分类,再在簇内重新估计(分类后估计)。
  • 通过参数化自举来处理偶然参数偏差,获得去偏估计量和有效的置信区间。
  • 提供信息准则 (IC) 以确定潜在簇的数量。
Figure 1: Diagram of classification and estimation procedure. It displays an example of the adjusted algorithm with four groups classified into two clusters.
Figure 1: Diagram of classification and estimation procedure. It displays an example of the adjusted algorithm with four groups classified into two clusters.

实验结果

研究问题

  • RQ1在没有先验簇标签的情况下,同行效应中的潜在分组结构能否一致地被识别?
  • RQ2同行效应是否在潜在簇之间异质,并且在任一簇内是否具有统计显著性?
  • RQ3在存在潜在结构的情况下,三步估计(NPL→C-Lasso→分类后NPL)是否在渐近意义上对推断有效?
  • RQ4在考虑偶然参数偏差后,基于自举的推断是否仍能提供有效的置信区间?
  • RQ5哪种准则最能确定数据中的潜在簇数量?

主要发现

  • 算法在 Add Health 数据中检测到两个潜在簇。
  • 同行效应在所检测簇中的一个簇内具有统计显著性。
  • 蒙特卡洛仿真显示在分类与参数估计方面具有较强的有限样本性能。
  • 所提出的自举方法在存在偶然参数偏差的情况下仍能提供有效的置信区间。
  • 潜在结构模型揭示了在同质参数假设下会被忽略的异质社交互动。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。