[论文解读] Influence Maximization in Continuous Time Diffusion Networks
本文提出 InfluMax 算法,用于在具有节点间异质传播速率的连续时间扩散网络中进行影响最大化。通过将扩散建模为连续时间马尔可夫过程,并利用随机最短路径框架进行影响的解析计算,InfluMax 在最先进方法基础上实现 20–30% 的性能提升,尤其在短时间范围内表现优异,具备可证明的近似保证,并通过惰性计算与局部搜索实现高效计算。
The problem of finding the optimal set of source nodes in a diffusion network that maximizes the spread of information, influence, and diseases in a limited amount of time depends dramatically on the underlying temporal dynamics of the network. However, this still remains largely unexplored to date. To this end, given a network and its temporal dynamics, we first describe how continuous time Markov chains allow us to analytically compute the average total number of nodes reached by a diffusion process starting in a set of source nodes. We then show that selecting the set of most influential source nodes in the continuous time influence maximization problem is NP-hard and develop an efficient approximation algorithm with provable near-optimal performance. Experiments on synthetic and real diffusion networks show that our algorithm outperforms other state of the art algorithms by at least ~20% and is robust across different network topologies.
研究动机与目标
- 为影响最大化研究中的空白提供解决方案,通过在扩散网络中引入异质且时变的传播速率。
- 开发一种高效、基于解析计算的方法,用于在连续时间内计算影响传播,避免依赖蒙特卡洛模拟或启发式方法。
- 为连续时间动力学下的影响最大化问题,提供一个可证明的近似最优近似算法。
- 在具有异质动力学的合成网络以及基于 MemeTracker 数据推断的真实世界扩散网络上评估该方法。
提出的方法
- 将信息扩散建模为具有边特定传播速率的连续时间马尔可夫过程,以实现更真实的时序动态。
- 利用 Kulkarni(1986)提出的随机最短路径框架,解析计算从给定源节点集合出发的感染节点期望数量。
- 利用影响函数的子模性,设计具有理论性能保证的贪心近似算法。
- 采用惰性计算与局部源节点搜索(跳数限制 m=6)以加速计算,同时将影响精度误差控制在 10% 以内。
- 可自然地按汇点与源点并行化,实现在大规模网络上的可扩展计算。
- 通过仅保留最快的 1,000 条边对网络进行稀疏化,以提升可扩展性,同时保持精度损失可忽略。
实验结果
研究问题
- RQ1当边的传播速率不同时,是否可以在连续时间扩散网络中实现影响传播的解析计算?
- RQ2在连续时间、异质动态下,影响最大化问题是否为 NP-难问题?是否可实现具有可证明保证的近似?
- RQ3与离散时间或同质速率模型相比,考虑时序动态是否能显著提升影响传播效果?
- RQ4在使用局部搜索与边稀疏化时,计算效率与影响精度之间的权衡如何?
主要发现
- 在具有异质时序动态的合成网络上,InfluMax 相较于最先进算法至少提升 20%,且在短时间范围内提升最为显著。
- 在基于 MemeTracker 超链接级联数据推断的真实世界扩散网络上,InfluMax 相较于现有方法实现 30% 的影响传播提升。
- 在 2,048 个节点的网络上,使用 m=6 跳的局部搜索使算法实现 5 倍加速,同时影响近似误差不超过 10%。
- 影响函数具有子模性,使得可使用具有可证明近似最优性能保证的贪心近似算法。
- 解析影响计算避免了对蒙特卡洛模拟或启发式方法的依赖,显著提升了效率与精度。
- 该方法在多种网络拓扑结构下均表现稳健,并在不同时间范围与源节点集合大小下保持稳定。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。