Skip to main content
QUICK REVIEW

[논문 리뷰] Data Poisoning Attack against Unsupervised Node Embedding Methods

Mingjie Sun, Jian Tang|arXiv (Cornell University)|2018. 10. 30.
Adversarial Robustness in Machine Learning참고 문헌 23인용 수 45
한 줄 요약

이 논문은 연결 예측을 위해 비감독 그래프 임베딩 방법(DeepWalk, LINE)을 대상으로 데이터를 오염시키는 프레임워크를 제시하며, 그래프에 엣지를 추가하거나 제거하기 위해 projected gradient descent를 사용하고, 방법 간 전이 가능성에 대한 무결성(정합성) 및 가용성 공격을 평가한다.

ABSTRACT

Unsupervised node embedding methods (e.g., DeepWalk, LINE, and node2vec) have attracted growing interests given their simplicity and effectiveness. However, although these methods have been proved effective in a variety of applications, none of the existing work has analyzed the robustness of them. This could be very risky if these methods are attacked by an adversarial party. In this paper, we take the task of link prediction as an example, which is one of the most fundamental problems for graph analysis, and introduce a data positioning attack to node embedding methods. We give a complete characterization of attacker's utilities and present efficient solutions to adversarial attacks for two popular node embedding methods: DeepWalk and LINE. We evaluate our proposed attack model on multiple real-world graphs. Experimental results show that our proposed model can significantly affect the results of link prediction by slightly changing the graph structures (e.g., adding or removing a few edges). We also show that our proposed model is very general and can be transferable across different embedding methods. Finally, we conduct a case study on a coauthor network to better understand our attack method.

연구 동기 및 목표

  • 비감독 그래프 임베딩이 연결 예측에 사용될 때의 강건성 문제를 제기한다.
  • 그래프에 엣지를 추가하거나 제거하여 데이터 오염을 수행하기 위한 통합 최적화 프레임워크를 개발한다.
  • 무결성 및 가용성 공격에 대한 공격자 유틸리티와 제약 조건을 규명한다.
  • 실세계 그래프에 대한 효과성, 전이성 및 사례 연구를 입증한다.

제안 방법

  • 비감독 그래프 임베딩(DeepWalk, LINE)을 암시적 행렬 분해로 모델링합니다(minimize ||R_Omega(Z-XY^T)||_F^2).
  • 데이터 오염을 엣지 수정 최적화로 표현하여 두 목표: 무결성 및 가용성 하에서 공격자 유틸리티를 극대화합니다.
  • 2단계의 PGD 절차를 사용합니다: (1) 가중 인접 행렬에 대한 경사 하강법; (2) 추가/삭제할 엣지를 선택하여 이진 인접으로 다시 투영.
  • DeepWalk와 LINE에 대해 ∇_A L을 얻기 위해 역전파를 이용한 1차(KKT) 조건으로 그래디언트를 계산합니다.
  • 각 방법의 Z 정의(Eq. 1, Eq. 2)와 연쇄 법칙으로 DeepWalk와 LINE의 그래디언트 성분을 도출합니다.
  • 투영 과정에서 추가(add)하려는 경우 1에 가까운 A_opt 값과 삭제(delete)하려는 경우 0에 가까운 값을 기준으로 후보 엣지를 선택합니다.

실험 결과

연구 질문

  • RQ1비감독 그래프 임베딩(DeepWalk, LINE)은 데이터 오염 공격에 얼마나 취약한가?
  • RQ2적은 수의 엣지 추가/삭제로 연결 예측을 효과적으로 저하시킬 수 있는 통합 최적화 프레임워크가 있는가?
  • RQ3오염 변화가 서로 다른 임베딩 방법 간에 전이 가능한가?
  • RQ4네트워크 구조의 어떤 특성이 공격의 효과(무결성 및 가용성)에 영향을 주는가?

주요 결과

  • 제안된 Opt-attack 프레임워크는 적은 수의 엣지 추가/삭제만으로도 연결 예측 점수를 크게 변화시킬 수 있다.
  • 공격은 서로 다른 임베딩 방법 간에 전이 가능하다(예: DeepWalk/LINE에서 다른 방법으로의 전이).
  • 실세계 그래프(Facebook, Cora, Citeseer)에 대한 실험에서 무결성 및 가용성 공격 모두에 대해 무작위 또는 휴리스틱 기준선보다 강력한 성능을 보인다.
  • 직접 공격(타깃 노드에 인접한 엣지 수정)과 간접 공격(다른 엣지 수정) 모두 효과적이며, 엣지 추가가 일반적으로 삭제보다 더 영향을 준다.
  • 공동저자 네트워크에 대한 사례 연구는 공격이 타깃 교차 분야 링크의 유사도 점수를 낮추고 가용성 공격 하에서 교차 분야 엣지를 더 추가하는 경향이 있음을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.