[论文解读] Uncovering the Temporal Dynamics of Diffusion Networks
该论文提出了 NetRate,一种凸优化框架,通过将传播速率建模为连续的、与边相关的过程,推断扩散网络的时间动态。该方法独特地从级联数据中同时估计网络结构和时变传播速率,无需参数调优或启发式稀疏惩罚,即可在合成数据和真实世界数据(包括超链接级联)上实现高精度和高召回率,优于先前的方法。
Time plays an essential role in the diffusion of information, influence and disease over networks. In many cases we only observe when a node copies information, makes a decision or becomes infected -- but the connectivity, transmission rates between nodes and transmission sources are unknown. Inferring the underlying dynamics is of outstanding interest since it enables forecasting, influencing and retarding infections, broadly construed. To this end, we model diffusion processes as discrete networks of continuous temporal processes occurring at different rates. Given cascade data -- observed infection times of nodes -- we infer the edges of the global diffusion network and estimate the transmission rates of each edge that best explain the observed data. The optimization problem is convex. The model naturally (without heuristics) imposes sparse solutions and requires no parameter tuning. The problem decouples into a collection of independent smaller problems, thus scaling easily to networks on the order of hundreds of thousands of nodes. Experiments on real and synthetic data show that our algorithm both recovers the edges of diffusion networks and accurately estimates their transmission rates from cascade data.
研究动机与目标
- 从仅观测到的感染时间推断扩散过程的底层网络结构和传播速率。
- 将信息、影响力或疾病传播的时间动态建模为具有可变传播速率的连续、边特定过程。
- 开发一种方法,自然地施加稀疏性并避免启发式参数调优。
- 通过解耦优化,实现对包含数十万节点的大规模网络的高效扩展。
- 通过估计连续传播速率而非假设各边上传播速率均匀或固定,超越先前方法。
提出的方法
- 该方法将扩散建模为一组连续时间、条件独立的过程,每个边具有特定的传播速率函数。
- 将推断问题表述为一个凸最大似然优化问题,联合估计网络边和传播速率。
- 似然函数基于生存分析,使用对数生存函数和风险函数来建模感染时间。
- 优化问题被解耦为每个节点的独立子问题,从而实现高效的并行化和可扩展性。
- 模型对传播似然使用参数形式(例如指数分布),其参数直接从级联数据中推断。
- 稀疏性由概率模型自然诱导,无需使用启发式 $l_1$ 类似惩罚。
实验结果
研究问题
- RQ1我们能否仅从扩散级联中观测到的感染时间,推断出底层网络结构和时变传播速率?
- RQ2我们如何对扩散网络中不同边的异质传播动态进行建模?
- RQ3我们能否在无需手动调优稀疏性参数的情况下,实现可扩展的凸推断?
- RQ4与假设传播速率均匀或使用启发式稀疏控制的最先进方法相比,我们方法的性能如何?
- RQ5该模型在真实世界的超链接级联和合成级联中,能在多大程度上恢复真实的网络结构和传播速率?
主要发现
- NetRate 在具有异质时间动态的合成网络上实现了高精度和高召回率,在多种参数设置下优于 NetInf 和 ConNIe。
- 在真实超链接数据上,NetRate 在其所有可调参数范围内均优于 NetInf 和 ConNIe,尽管使用的是简单的参数化模型。
- 该方法产生唯一解,而 NetInf 和 ConNIe 会产生需任意选择的解曲线。
- NetRate 准确估计传播速率,这是先前方法(如 NetInf 和 ConNIe)所不具备的能力。
- 模型的凸形式化使得通过自然并行化高效扩展至包含数十万节点的网络成为可能。
- 由于避免了启发式稀疏惩罚,性能优于依赖此类项且在异质动态下性能下降的 ConNIe。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。