Skip to main content
QUICK REVIEW

[论文解读] Censoring Out-Degree Compromises Inferences of Social Network Contagion and Autocorrelation

Andrew C. Thomas|arXiv (Cornell University)|Aug 10, 2010
Opinion Dynamics and Social Influence被引用 4
一句话总结

本文研究了在社交网络中对出度进行删失(即限制个体命名所有朋友的能力)如何影响社会网络传染与自相关模型中的推断。研究发现,不完整的边信息会导致效应量膨胀或估计量集中在零点,而朋友数量的异质性是决定是否可通过调整实现有效推断的关键因素。

ABSTRACT

I examine the consequences of modelling contagious influence in a social network with incomplete edge information, namely in the situation where each individual may name a limited number of friends, so that extra outbound ties are censored. In particular, I consider a prototypical time series configuration where a property of the ego is affected in a causal fashion by the properties of their at a previous time point, both in the total number of alters as well as the deviation from a central value. This is considered with three potential methods for naming one's friends: a strict upper limit on the number of declarations, a flexible limit, and an instruction where a person names a prespecified fraction of their friends. I find that one of two effects is present in the estimation of these effects: either that the size of the effect is inflated in magnitude, or that the estimators instead are centered about zero rather than related to the true effect. The degree of heterogeneity in friend count is one of the major factors into whether such an analysis can be salvaged by post-hoc adjustments.

研究动机与目标

  • 评估不完整社交网络数据(特别是删失的出度)对估计社会传染与自相关效应的影响。
  • 评估不同朋友命名限制(固定上限、灵活上限、固定比例)对估计精度的影响。
  • 确定在不完整边报告情况下,事后调整是否能恢复有效推断。
  • 识别影响删失校正可行性的结构性网络特征,特别是朋友数量的异质性。

提出的方法

  • 使用时间序列框架对社会影响进行建模,其中自我在时间 t 的属性取决于其关联对象在时间 t-1 的属性。
  • 模拟三种不同的朋友命名协议:严格上限、灵活上限和固定比例命名朋友。
  • 在每种命名协议下,使用标准网络回归模型估计传染与自相关效应。
  • 通过将估计效应与真实基础值比较,评估估计量偏差与效应量失真。
  • 分析度异质性在决定事后校正是否能缓解删失偏差中的作用。
  • 使用基于模拟的推断方法,评估不同网络结构与删失机制下估计量的稳健性。

实验结果

研究问题

  • RQ1删失出度如何影响网络模型中社会传染效应的估计?
  • RQ2朋友命名限制类型(固定上限、灵活上限、固定比例)是否会影响传染效应估计的偏差或精度?
  • RQ3当出度被删失时,事后调整是否能恢复有效推断?
  • RQ4网络度异质性在多大程度上调节删失对估计精度的影响?
  • RQ5在何种条件下,估计量会集中在零点而非反映真实效应量?

主要发现

  • 删失出度导致两种主要估计问题:要么传染效应的量级被高估,要么估计量集中在零点,表明无法检测到效应。
  • 网络中存在度异质性显著增加了估计偏差的风险,使删失校正更加困难。
  • 在固定比例命名协议下,估计量表现出比固定下限或灵活上限更一致的偏差模式。
  • 当删失严重或度异质性较高时,事后调整通常不足以恢复准确推断。
  • 当高 out-degree 个体因删失而系统性地被低估时,估计量集中在零点的风险尤为显著。
  • 网络结构,尤其是朋友数量的方差,是决定是否能通过统计校正缓解删失的关键因素。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。