Skip to main content
QUICK REVIEW

[论文解读] Attacking Similarity-Based Link Prediction in Social Networks

Kai Zhou, Tomasz Michalak|arXiv (Cornell University)|Sep 22, 2018
Complex Network Analysis Techniques参考文献 25被引用 37
一句话总结

本文提出了一套全面的算法框架,通过战略性地删除边来攻击社交网络中的基于相似性的链接预测,以最小化目标链接的相似性得分。该文证明了对于局部和全局度量,该问题均为NP难问题,但仍提出了高效的近似算法(如Approx-Local和Greedy-Katz),并提供了可证明的保证,实验证明其在真实和合成网络上相较于基线方法在降低链接预测得分方面表现出色。

ABSTRACT

Link prediction is one of the fundamental problems in computational social science. A particularly common means to predict existence of unobserved links is via structural similarity metrics, such as the number of common neighbors; node pairs with higher similarity are thus deemed more likely to be linked. However, a number of applications of link prediction, such as predicting links in gang or terrorist networks, are adversarial, with another party incentivized to minimize its effectiveness by manipulating observed information about the network. We offer a comprehensive algorithmic investigation of the problem of attacking similarity-based link prediction through link deletion, focusing on two broad classes of such approaches, one which uses only local information about target links, and another which uses global network information. While we show several variations of the general problem to be NP-Hard for both local and global metrics, we exhibit a number of well-motivated special cases which are tractable. Additionally, we provide principled and empirically effective algorithms for the intractable cases, in some cases proving worst-case approximation guarantees.

研究动机与目标

  • 研究在攻击者可删除边以隐藏目标链接的对抗性环境下,基于相似性的链接预测的脆弱性。
  • 将攻击形式化为一个优化问题,即在有限的边删除预算下,最小化目标链接的加权相似性得分。
  • 将相似性度量分类为局部(如共同邻居)和全局(如Katz、ACT)两类,并分析每类的攻击复杂度。
  • 识别可解的特殊情况(如攻击单个链接或一组节点),并为这些情况设计最优或近似最优的算法。
  • 为难以求解的情况设计实用且有理论依据的算法,特别是针对全局度量。

提出的方法

  • 将攻击建模为一个二值整数线性规划(BILP),以确定最优的边删除策略,包含总删除数量和每节点删除上限的约束。
  • 提出Approx-Local,一种基于在基数约束下最大化子模函数的贪心算法,用于最小化局部相似性度量的上界。
  • 引入Greedy-Katz,一种启发式算法,用于最小化Katz相似性,实验表明其有效且具有近似保证。
  • 提出Local-ACT,一种基于局部网络结构的有原则的启发式算法,用于最小化ACT距离,通过优先删除高影响力边来提升效果。
  • 对BILP公式采用线性规划松弛,以计算接近最优的边删除方案,尤其适用于特殊情况。
  • 在无标度网络和一个真实的Facebook好友关系网络上验证算法性能,与RandomDel和GreedyBase基线方法进行比较。

实验结果

研究问题

  • RQ1通过边删除最小化相似性得分的问题,对局部和全局相似性度量是否均为NP难?
  • RQ2在特殊情况下(如攻击单个链接或一组节点)能否找到最优或近似最优解?
  • RQ3针对难以求解的情况,特别是Katz和ACT等全局度量,所提算法的近似保证是什么?
  • RQ4与现有启发式方法(如GreedyBase和RandomDel)相比,所提算法在实际中的有效性如何?
  • RQ5所提算法在不同网络规模和拓扑结构下的性能是否具有良好的可扩展性?

主要发现

  • 即使仅针对单个目标链接,使用Katz和ACT等全局度量时,攻击基于相似性的链接预测问题仍为NP难。
  • 对于局部度量,在两种特殊情况下可实现最优攻击:攻击单个链接或一组节点(使用CND度量),从而可获得精确解。
  • Approx-Local在局部度量上的近似质量可控制在最优上界20%以内,且实证性能表现优异。
  • Greedy-Katz和Local-ACT在合成网络和真实网络上,相较于GreedyBase启发式方法,在降低Katz和ACT相似性得分方面表现显著更优。
  • 仅通过少量战略性删除的边(如k=5–10),即可使目标链接的相似性得分降低高达50–70%,证明了攻击的高度有效性。
  • 所提算法在多种网络拓扑结构(包括无标度网络和Facebook好友关系网络,n=786, m=12,291)中均保持了强劲的性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。