[论文解读] COEVOLVE: A Joint Point Process Model for Information Diffusion and Network Co-evolution
COEVOLVE 提出了一种联合的时变点过程模型,联合建模在线社交网络中的信息传播与网络共演化,使用多变量霍克斯过程建模转发行为,使用信息驱动的生存过程建模链接创建,并在两者之间实现双向影响。该模型支持高效的模拟与凸优化参数学习,在真实 Twitter 数据上对转发事件和链接事件的预测性能优于基线模型。
Information diffusion in online social networks is affected by the underlying network topology, but it also has the power to change it. Online users are constantly creating new links when exposed to new information sources, and in turn these links are alternating the way information spreads. However, these two highly intertwined stochastic processes, information diffusion and network evolution, have been predominantly studied separately, ignoring their co-evolutionary dynamics. We propose a temporal point process model, COEVOLVE, for such joint dynamics, allowing the intensity of one process to be modulated by that of the other. This model allows us to efficiently simulate interleaved diffusion and network events, and generate traces obeying common diffusion and network patterns observed in real-world networks. Furthermore, we also develop a convex optimization framework to learn the parameters of the model from historical diffusion and network evolution traces. We experimented with both synthetic data and data gathered from Twitter, and show that our model provides a good fit to the data as well as more accurate predictions than alternatives.
研究动机与目标
- 建模在线社交网络中信息传播与网络演化之间的双向影响。
- 开发一种联合概率框架,捕捉转发行为如何驱动新链接形成,反之亦然。
- 实现从真实世界事件轨迹中高效模拟与参数学习。
- 相比将两个过程分开建模的模型,提升对转发事件与链接事件的预测准确性。
- 在合成数据与大规模 Twitter 数据集上验证模型,证明其能忠实再现现实世界中的模式。
提出的方法
- 使用带有身份揭示性激发的多变量霍克斯过程建模转发事件,其中每次转发的强度取决于源用户的身份与影响力。
- 将链接创建建模为由转发强度驱动的生存过程,新链接优先形成于活跃度高的信息源。
- 采用奥加塔算法实现高效事件采样,通过稀疏感知采样优化,实现 O(nd log m) 的时间复杂度。
- 应用凸优化方法,通过最大化观测到的信息传播与网络演化事件的联合似然函数来学习模型参数。
- 引入时变影响力与异构触发核函数,以捕捉精细的时序动态。
- 采用拒绝采样框架,在连续时间内模拟交错发生的信息传播与网络事件。
实验结果
研究问题
- RQ1如何建模在线社交网络中信息传播与网络结构形成的共演化?
- RQ2转发事件对新社交链接创建有何影响?
- RQ3联合模型是否能相比独立建模显著提升对转发事件与链接事件的预测准确性?
- RQ4我们能以多高的效率模拟与学习此类共演化系统?
- RQ5该模型在级联结构、节点度分布与网络直径等方面,能在多大程度上再现现实世界中的模式?
主要发现
- COEVOLVE 模型成功捕捉了信息传播与网络演化之间的双向影响,其中转发行为驱动新链接形成于有影响力的源头。
- 该模型生成的合成数据与真实世界模式高度一致,包括级联规模、深度、节点度分布以及网络直径的缩小趋势。
- 通过凸优化进行参数学习,实现了高效且可扩展的推理,使该模型可应用于大规模 Twitter 数据集。
- 在真实 Twitter 数据上,该模型在预测转发事件与链接事件方面显著优于基线模型,预测准确性更高。
- 采样过程的时间复杂度为 O(nd log m),使其在真实网络上模拟大规模共演化动态成为可能。
- 该模型能够揭示转发中的源身份,从而实现对影响力传播与链接目标定位的更精确建模。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。