QUICK REVIEW

[论文解读] Estimation of Peer Effects in Endogenous Social Networks: Control Function Approach

Ida Johnsson, Hyungsik Roger Moon|arXiv (Cornell University)|Sep 28, 2017

Advanced Causal Inference Techniques参考文献 44被引用 24

一句话总结

本文提出了一种半参数控制函数方法，用于估计内生社会网络中的同伴效应，其中未观测到的个体特征会影响网络形成和结果。通过非参数化建模内生性的控制函数并使用sieve估计，该方法在密集网络渐近条件下实现了具有一致性的识别和渐近正态性，为在未观测异质性与网络链接相关联的设定下，提供了对参数方法或工具变量方法的稳健替代方案。

ABSTRACT

We propose a method of estimating the linear-in-means model of peer effects in which the peer group, defined by a social network, is endogenous in the outcome equation for peer effects. Endogeneity is due to unobservable individual characteristics that influence both link formation in the network and the outcome of interest. We propose two estimators of the peer effect equation that control for the endogeneity of the social connections using a control function approach. We leave the functional form of the control function unspecified and treat it as unknown. To estimate the model, we use a sieve semiparametric approach, and we establish asymptotics of the semiparametric estimator.

研究动机与目标

解决由于未观测到的个体特征同时影响网络形成和结果而引起的同伴效应估计中的内生性问题。
开发一种非参数控制函数方法，无需对未观测异质性的函数形式做参数假设。
在密集、内生社会网络的背景下，建立sieve半参数估计量的渐近理论。
提供使用估计的未观测异质性或网络度数统计量作为控制函数代理变量的经验实现策略。
通过蒙特卡洛模拟，比较所提出估计量与线性及工具变量方法在小样本下的性能。

提出的方法

采用控制函数方法校正同伴效应模型中的内生性，其中网络链接因未观测到的个体特征而内生。
未指定控制函数的函数形式，将其视为未观测到的个体异质性的非参数函数。
采用sieve半参数估计方法，通过基函数展开（如多项式）近似未知的控制函数。
提出两种实用估计量：一种基于估计的个体层面未观测异质性，另一种使用平均节点度数和协变量作为代理。
在大单网络渐近框架下推导估计量的极限分布，考虑由于密集网络结构导致的强依赖性。
提供标准误校正方法，以在观测变量存在强依赖性的情况下实现有效的推断。

实验结果

研究问题

RQ1当社会网络由于影响链接形成和结果的未观测到的个体特征而内生时，同伴效应能否被一致识别？
RQ2当控制函数的函数形式未知且可能复杂时，如何对其进行非参数估计？
RQ3与参数方法或工具变量方法相比，所提出的半参数估计量在小样本下的性质如何？
RQ4控制函数代理变量的选择——估计的异质性与网络度数——如何影响估计精度和假设检验的大小？
RQ5在密集网络渐近条件下，sieve估计量的渐近分布是什么？如何一致地估计标准误？

主要发现

所提出的sieve半参数估计量在密集网络渐近框架下实现了根N一致性与渐近正态性，即使观测变量之间存在强依赖性亦成立。
在蒙特卡洛模拟中，采用非参数估计函数（如多项式）的控制函数估计量在小样本下表现优于线性控制函数和IV估计量，尤其在未观测特征与网络链接高度相关时表现更优。
基于估计未观测异质性（CF-2）的估计量与基于平均节点度数（CF-3）的估计量均表现出低偏差和正确的t检验经验大小，不同网络密度下的经验大小接近名义水平（如0.05）。
当真实控制函数为非线性时（如指数、正弦、余弦函数），非参数sieve方法显著优于线性控制函数假设（CF-1），后者存在显著偏差。
即使在网络稀疏时（如平均度数~4），该方法仍保持良好性能，t检验的经验大小约为0.05，参数估计偏差较低。
未观测特征与协变量之间的相关性（如corr(a_i, x_2i) ≈ 0.87）不会使估计量失效，证实了其对未观测变量中高依赖性的稳健性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。