[论文解读] IRIE: Scalable and Robust Influence Maximization in Social Networks
IRIE 是一种新颖、可扩展且鲁棒的影响最大化算法,结合了迭代影响排序(IR)与快速影响估计(IE),在 IC 和 IC-N 模型下,对多样化网络拓扑结构和级联规模均保持或提升影响覆盖范围的同时,相比最先进的方法如 PMIA,性能提升高达两个数量级,且显著降低内存使用量。
Influence maximization is the problem of selecting top $k$ seed nodes in a social network to maximize their influence coverage under certain influence diffusion models. In this paper, we propose a novel algorithm IRIE that integrates a new message passing based influence ranking (IR), and influence estimation (IE) methods for influence maximization in both the independent cascade (IC) model and its extension IC-N that incorporates negative opinion propagations. Through extensive experiments, we demonstrate that IRIE matches the influence coverage of other algorithms while scales much better than all other algorithms. Moreover IRIE is more robust and stable than other algorithms both in running time and memory usage for various density of networks and cascade size. It runs up to two orders of magnitude faster than other state-of-the-art algorithms such as PMIA for large networks with tens of millions of nodes and edges, while using only a fraction of memory comparing with PMIA.
研究动机与目标
- 解决现有影响最大化算法在大规模社交网络中可扩展性和鲁棒性的局限性。
- 开发一种方法,在相比最先进的启发式算法(如 PMIA)大幅降低运行时间和内存使用量的同时,仍能保持高影响覆盖范围。
- 设计一种在不同网络密度、聚类系数和级联规模下均保持稳定的框架。
- 将该方法扩展至 IC-N 模型,以支持负面意见传播,提升其适用范围。
- 通过依赖全局迭代计算而非复杂局部数据结构,实现高效的并行化。
提出的方法
- IRIE 使用一种受信念传播启发的迭代排序(IR)方法,在少量迭代内全局排序节点的影响潜力。
- 在选择影响潜力最高的节点作为种子后,IRIE 执行快速影响估计(IE)步骤,计算该种子对所有其他节点的附加影响。
- 利用 IE 结果在后续轮次中动态调整影响排序,减少冗余计算并提升准确性。
- 该算法避免存储局部影响区域或复杂数据结构,从而实现极低的内存开销。
- 由于依赖全局迭代更新,IRIE 可在 Pregel 等图计算平台上轻松实现并行化。
- 通过引入负面意见传播,将该方法扩展至 IC-N 模型,在保持效率的同时维持影响覆盖范围。
实验结果
研究问题
- RQ1能否设计一种全局影响排序方法,以替代影响最大化中昂贵的蒙特卡洛模拟?
- RQ2如何高效地将影响估计与影响排序结合,以在计算成本极低的前提下维持高影响覆盖范围?
- RQ3IRIE 在速度、内存使用和稳定性方面相较于 PMIA 在多样化网络结构中的表现如何?
- RQ4IRIE 框架能否有效扩展至包含负面意见传播的 IC-N 模型?
- RQ5IRIE 的性能在网络规模和边密度增加时如何扩展,特别是在平均度 >10 的密集网络中?
主要发现
- 在包含数千万个节点和边的大规模网络上,IRIE 的执行速度相比 PMIA 最快可提升两个数量级。
- 在 LiveJournal 数据集中,IRIE 仅使用 3GB 内存,而 PMIA 需要 10GB——内存使用量降低 70%。
- 在 TR 模型中,IRIE 在 IC-N 模型上的速度比 MIA-N 快 5 至 50 倍,同时实现相当或更优的影响传播效果。
- IRIE 的运行时间显著比 PMIA 更稳定,后者对网络聚类和边密度高度敏感。
- 在 Arxiv 和 Wiki 数据集上,IRIE 在 WC 和 TR 模型下均比 CELF 贪心算法快超过 1,000 倍。
- 在所有测试配置中,包括最大达 6900 万条边的真实世界网络,IRIE 的影响覆盖范围均匹配或超过 PMIA、SAEDV、PageRank 和度数启发式方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。