[论文解读] Epidemiological modeling of online social network dynamics
本文提出了一种传染性恢复SIR(irSIR)模型,通过将用户活动建模为类似疾病的传播过程,解释在线社交网络(OSN)用户的采纳与放弃行为,其中恢复(放弃)仅通过与感染者接触而发生。该模型拟合了MySpace的Google搜索数据,并预测Facebook将迅速衰落,到2017年用户数量将减少80%。
The last decade has seen the rise of immense online social networks (OSNs) such as MySpace and Facebook. In this paper we use epidemiological models to explain user adoption and abandonment of OSNs, where adoption is analogous to infection and abandonment is analogous to recovery. We modify the traditional SIR model of disease spread by incorporating infectious recovery dynamics such that contact between a recovered and infected member of the population is required for recovery. The proposed infectious recovery SIR model (irSIR model) is validated using publicly available Google search query data for "MySpace" as a case study of an OSN that has exhibited both adoption and abandonment phases. The irSIR model is then applied to search query data for "Facebook," which is just beginning to show the onset of an abandonment phase. Extrapolating the best fit model into the future predicts a rapid decline in Facebook activity in the next few years.
研究动机与目标
- 通过流行病学建模解释在线社交网络(OSN)中用户采纳与放弃行为的动力学。
- 解决传统SIR模型在捕捉OSN生命周期模式(尤其是放弃动态)方面的局限性。
- 使用真实世界的Google搜索查询数据对MySpace进行案例研究,验证改进后的SIR模型。
- 将验证后的模型应用于Facebook,并预测其未来用户活跃度的下降趋势。
- 提供一种基于搜索查询趋势作为用户参与度代理指标的数据驱动、可预测的OSN生命周期分析框架。
提出的方法
- 通过引入传染性恢复动态,对经典SIR模型进行改进,其中恢复(放弃)仅在感染者与已恢复个体接触时发生。
- 修改SIR模型中的恢复项,使其依赖于感染者和已恢复者的人口数量,由参数ν表示,以反映社会影响对放弃行为的作用。
- 使用'Google Trends'的'MySpace'和'Facebook'搜索查询数据作为用户活跃度和网络流行度的代理指标。
- 采用非线性最小二乘法校准模型参数(β, γ, ν, R₀)以匹配观测到的搜索量数据。
- 基于最佳拟合结果的SSE高出15%的预测区间,量化未来预测的不确定性。
- 将20%的用户活跃度阈值作为'生命周期终结'的代理指标,用于定义OSN预测的衰落日期。
实验结果
研究问题
- RQ1流行病学模型能否有效描述在线社交网络的采纳与放弃动态?
- RQ2为何传统SIR模型无法捕捉像MySpace这样的OSN的完整生命周期?
- RQ3将传染性恢复动态纳入模型在多大程度上改善了对OSN用户活跃度数据的拟合效果?
- RQ4Google搜索查询数据在多大程度上可作为OSN实际用户参与度的可靠代理?
- RQ5基于irSIR模型和现有数据,Facebook未来的趋势预测如何?
主要发现
- 与传统SIR模型相比,irSIR模型在拟合MySpace搜索数据时,均方误差(SSE)降低了75%。
- 该模型成功捕捉了MySpace的采纳与放弃阶段,其用户活跃度在2008年达到顶峰,并于2011年衰落到几乎被遗忘。
- 2004年1月至2012年期间的Facebook搜索数据与irSIR模型高度吻合,表明其具有强大的预测能力。
- 基于最佳拟合irSIR模型的外推预测显示,Facebook将在2015至2017年间损失80%的峰值用户基数。
- 预测区间显示,由于2012年后数据稀缺以及模型预测的非对称不确定性,实际衰落速度可能比最佳拟合曲线更缓慢。
- 20%用户活跃度阈值(定义为'生命周期终结')预计将在2014年12月达到,而模型的预测区间从2013年末延伸至2015年初。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。