[论文解读] Dose-response functions and surrogate models for exploring social contagion in the Copenhagen Networks Study
本文提出了一种剂量-反应函数(DRF)和代理数据建模框架,用于检测时间社交网络中的基于网络的传染效应与同质性。应用于哥本哈根网络研究数据时,该方法未发现针对健身行为的显著剂量-反应传染效应或同质性,表明个体倾向与外部影响更能解释所观察到的动力学特征。
Spreading dynamics and complex contagion processes on networks are important mechanisms underlying the emergence of critical transitions, tipping points and other nonlinear phenomena in complex human and natural systems. Increasing amounts of temporal network data are now becoming available to study such spreading processes of behaviours, opinions, ideas, diseases and innovations to test hypotheses regarding their specific properties. To this end, we here present a methodology based on dose-response functions and hypothesis testing using surrogate data models that randomise most aspects of the empirical data while conserving certain structures relevant to contagion, group or homophily dynamics. We demonstrate this methodology for synthetic temporal network data of spreading processes generated by the adaptive voter model. Furthermore, we apply it to empirical temporal network data from the Copenhagen Networks Study. This data set provides a physically-close-contact network between several hundreds of university students participating in the study over the course of three months. We study the potential spreading dynamics of the health-related behaviour "regularly going to the fitness studio" on this network. Based on a hierarchy of surrogate data models, we find that our method neither provides significant evidence for an influence of a dose-response-type network spreading process in this data set, nor significant evidence for homophily. The empirical dynamics in exercise behaviour are likely better described by individual features such as the disposition towards the behaviour, and the persistence to maintain it, as well as external influences affecting the whole group, and the non-trivial network structure. The proposed methodology is generic and promising also for applications to other temporal network data sets and traits of interest.
研究动机与目标
- 开发一种稳健的方法学,利用剂量-反应函数(DRFs)检测时间网络数据中的复杂传染与同质性。
- 解决在观察性数据中区分因果传染效应与混杂因素(如同质性、外部影响及网络结构)的挑战。
- 检验哥本哈根网络研究的实证时间网络数据是否表现出可检测的基于网络的传播动力学,针对健康相关行为。
- 评估代理数据模型在隔离传染过程痕迹与其它动力学机制方面的有效性。
- 提供一种通用且可迁移的框架,用于分析多样化时间网络系统中的传播过程,包括可持续性转型与公共卫生动力学。
提出的方法
- 构建剂量-反应函数(DRFs),以基于其网络邻居的暴露水平建模节点采纳某一特征的概率。
- 应用高斯滤波技术,从合成与实证时间网络数据中稳健估计DRFs,包括不确定性传播。
- 设计一套代理数据模型层级,随机化数据的大部分特征,同时保留与传染或同质性相关的关键结构特征。
- 利用代理模型进行非参数假设检验:将实证DRFs与随机化数据生成的DRFs进行比较,以评估统计显著性。
- 实施多层级代理建模方法,逐步放松约束条件(如保留度序列、时间顺序或特征动态),以检验结果对不同假设的敏感性。
- 整合生成模型(如自适应投票者模型),在真实实证数据应用前,先在合成数据上验证该方法的有效性。
实验结果
研究问题
- RQ1哥本哈根网络研究中观察到的规律性健身工作室使用行为的传播是否表现出指示社会传染的剂量-反应关系?
- RQ2观察到的行为动态在多大程度上可由同质性解释,即具有相似特征的个体之间偏好关联?
- RQ3实证数据中是否存在可检测的基于网络的传染过程痕迹,而非个体层面的持续性或外部群体影响?
- RQ4研究结果对网络结构、时间分辨率和特征测量的不同假设有多大的稳健性?
- RQ5所提出的代理建模框架能否有效区分复杂时间网络数据中传染与其它机制?
主要发现
- 分析未发现哥本哈根网络研究数据中存在与剂量-反应型网络传染过程相关的显著统计证据,针对规律性健身工作室使用行为。
- 同样,也未发现显著证据支持同质性作为该数据集中观察到的行为动态的驱动因素。
- 实证中健身行为的传播更佳地由个体层面的倾向与行为持续性,以及外部群体影响解释。
- 在所提出的DRF与代理建模框架下,时间网络的非平凡结构未产生可检测的传染信号。
- 该方法成功排除了网络驱动的传染与同质性作为主要机制,凸显了个体与环境因素的重要性。
- 代理建模层级有效隔离了网络结构与时间动态的影响,证明了该方法对混杂因素的敏感性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。