[论文解读] Scalable Graph Neural Network-based framework for identifying critical nodes and links in Complex Networks
该论文提出了一种基于归纳式图神经网络(GNN)的框架 ILGR,通过从少量节点/链路中学习关键性得分,高效识别大规模复杂网络中的关键节点和链路。该模型在 Top-5% 范围内的识别准确率超过 90%,且执行速度比传统迭代方法快多个数量级,实现了在合成网络与真实网络中可扩展且通用的鲁棒性分析。
Identifying critical nodes and links in graphs is a crucial task. These nodes/links typically represent critical elements/communication links that play a key role in a system's performance. However, a majority of the methods available in the literature on the identification of critical nodes/links are based on an iterative approach that explores each node/link of a graph at a time, repeating for all nodes/links in the graph. Such methods suffer from high computational complexity and the resulting analysis is also network-specific. To overcome these challenges, this article proposes a scalable and generic graph neural network (GNN) based framework for identifying critical nodes/links in large complex networks. The proposed framework defines a GNN based model that learns the node/link criticality score on a small representative subset of nodes/links. An appropriately trained model can be employed to predict the scores of unseen nodes/links in large graphs and consequently identify the most critical ones. The scalability of the framework is demonstrated through prediction of nodes/links scores in large scale synthetic and real-world networks. The proposed approach is fairly accurate in approximating the criticality scores and offers a significant computational advantage over conventional approaches.
研究动机与目标
- 解决现有迭代方法在大规模图中识别关键节点/链路时计算复杂度高的问题。
- 开发一种通用且可扩展的框架,能够泛化于多种网络类型和鲁棒性度量。
- 通过训练好的 GNN 模型,实现对未见节点/链路的关键性得分快速归纳预测。
- 在保持高识别准确率的同时,显著缩短真实网络与合成网络中关键节点/链路识别的执行时间。
- 通过在结构变化后无需从头开始重新训练,支持动态网络分析,实现实时重预测。
提出的方法
- 在合成图上端到端训练 GNN 模型,从局部子图邻域中学习节点和链路的嵌入表示。
- 在节点/链路嵌入上使用回归头,基于两种鲁棒性度量(有效图电阻 Rg 和加权谱 Ws)预测关键性得分。
- 在少量代表性节点/链路子集上训练模型,以实现对更大图中未见节点/链路的归纳迁移。
- 对于链路,通过可学习聚合层将两个连接节点的嵌入组合生成链路嵌入。
- 采用两阶段框架:(1) 在合成数据上离线训练,(2) 在未见图上进行在线推理,延迟极低。
- 利用 GNN 的归纳偏差,在无需重新训练的情况下泛化于不同网络类型和规模。
实验结果
研究问题
- RQ1基于 GNN 的归纳模型能否在仅使用少量训练数据的情况下,对多种网络类型中的关键节点/链路实现高准确率预测?
- RQ2与逐个计算关键性得分的传统迭代方法相比,所提出的 GNN 框架在速度和准确率方面表现如何?
- RQ3该模型在未参与训练的真实网络上的泛化能力有多强?
- RQ4与仅基于节点的预测相比,引入链路级嵌入(由节点对生成)是否能提升识别准确率?
- RQ5随着图规模和复杂度的增加,模型性能如何变化?
主要发现
- 在 PL 合成图上,ILGR 框架对 Rg 的 Top-5% 识别准确率为 91%,对 Ws 为 94%;在 PLC 合成图上,对 Rg 为 97.5%,对 Ws 为 96.1%。
- 在真实网络中,模型保持高准确率:生物酵母网络中 Rg-plc 为 92.6%,Ws-plc 为 95.2%;美国电网网络中 Rg-plc 为 93.1%,Ws-plc 为 94.6%;维基投票网络中 Rg-plc 为 89.6%,Ws-plc 为 92.5%。
- 在 Wiki-Vote 等大规模图上,该方法将执行时间从传统方法的超过 64,000 秒减少至 25 秒以下,实现了多个数量级的速度提升。
- 该模型无需微调即可有效泛化至真实网络,展现出强大的归纳偏差和迁移能力。
- 由于链路嵌入基于成对节点表示,信息更丰富,因此链路识别性能略高于节点识别。
- 该框架计算高效且可扩展,训练时间显著低于传统方法,且在包含最多 50,000 个节点和链路的图上,推理时间仍保持极低水平。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。