Skip to main content
QUICK REVIEW

[논문 리뷰] IMRank: Influence Maximization via Finding Self-Consistent Ranking

Suqi Cheng, Huawei Shen|arXiv (Cornell University)|2014. 02. 17.
Spam and Phishing Detection참고 문헌 22인용 수 29
한 줄 요약

IMRank는 노드의 순위가 각각의 순위 기반 영향력 확산과 일치하는 자기일관성 있는 순위로 수렴하는 반복적 랭킹 프레임워크이다. 마지막에서 첫 번째로 자원을 할당하는 전략을 활용해 신속하게 추정하고, 도수나 강도와 같은 임의의 초기 순위에서 시작함으로써 휴리스틱 수준의 효율성과 게리프 수준의 정확도를 동시에 달성한다. 이는 대규모 네트워크에서 기존 최고 수준의 방법들보다 최대 100배 빠른 속도로 영향력 확산을 유지하면서도 뛰어난 성능을 발휘한다.

ABSTRACT

Influence maximization, fundamental for word-of-mouth marketing and viral marketing, aims to find a set of seed nodes maximizing influence spread on social network. Early methods mainly fall into two paradigms with certain benefits and drawbacks: (1)Greedy algorithms, selecting seed nodes one by one, give a guaranteed accuracy relying on the accurate approximation of influence spread with high computational cost; (2)Heuristic algorithms, estimating influence spread using efficient heuristics, have low computational cost but unstable accuracy. We first point out that greedy algorithms are essentially finding a self-consistent ranking, where nodes' ranks are consistent with their ranking-based marginal influence spread. This insight motivates us to develop an iterative ranking framework, i.e., IMRank, to efficiently solve influence maximization problem under independent cascade model. Starting from an initial ranking, e.g., one obtained from efficient heuristic algorithm, IMRank finds a self-consistent ranking by reordering nodes iteratively in terms of their ranking-based marginal influence spread computed according to current ranking. We also prove that IMRank definitely converges to a self-consistent ranking starting from any initial ranking. Furthermore, within this framework, a last-to-first allocating strategy and a generalization of this strategy are proposed to improve the efficiency of estimating ranking-based marginal influence spread for a given ranking. In this way, IMRank achieves both remarkable efficiency and high accuracy by leveraging simultaneously the benefits of greedy algorithms and heuristic algorithms. As demonstrated by extensive experiments on large scale real-world social networks, IMRank always achieves high accuracy comparable to greedy algorithms, with computational cost reduced dramatically, even about $10-100$ times faster than other scalable heuristics.

연구 동기 및 목표

  • 대규모 사회적 네트워크에서 정확성과 효율성 간의 상충 관계를 해결하기 위해.
  • 시드 선택과 영향력 확산 추정을 통합하기 위해 문제를 자기일관성 있는 노드 랭킹 찾기 문제로 재정의하기 위해.
  • 임의의 초기 랭킹에서 시작하여 수렴하는 최적의 랭킹을 확보하는 반복적 프레임워크를 개발하기 위해.
  • 다시 계산하지 않고도 순위 기반 경계 영향력 확산을 효율적으로 추정하는 전략을 설계하기 위해.
  • 실제 응용에서 높은 정확성(게리프 알고리즘 수준)과 뛰어난 확장성(기존 휴리스틱보다 뛰어남)을 동시에 달성하기 위해.

제안 방법

  • IMRank는 자기일관성 있는 랭킹을 찾기 위한 반복적 과정으로 영향력 확산 최적화 문제를 재구성한다. 여기서 노드의 순위는 그 순위 기반 경계 영향력 확산과 일치한다.
  • 도수나 강도와 같은 초기 랭킹에서 시작하여, 현재 순위 기반 경계 영향력 확산에 따라 노드를 반복적으로 재정렬한다.
  • 독립 캐스케이드 모델의 구조를 활용해, 가장 낮은 순위의 노드들로부터 영향력을 거꾸로 전파함으로써 효율적으로 경계 영향력 확산을 추정하기 위해 '마지지에서 첫 번째로 자원 할당' 전략을 도입한다.
  • 계산 효율성을 유지하면서 추정 정확도를 향상시키기 위해 이 전략을 일반화한다.
  • 이론적 분석을 통해 IMRank는 임의의 초기 랭킹에서 시작하여 유한한 단계 내에 자기일관성 있는 랭킹으로 수렴함을 증명한다.
  • 반복 과정 동안 영향력 확산 계산을 재사용함으로써 게리프 수준의 정확성과 휴리스틱 수준의 효율성을 통합한다.

실험 결과

연구 질문

  • RQ1정확성과 효율성을 균형 잡는 데 있어 영향력 확산 최적화 문제를 자기일관성 있는 랭킹 문제로 재정의할 수 있는가?
  • RQ2임의의 초기 랭킹에서 시작하여 안정적이고 최적의 랭킹으로 수렴하는 반복적 랭킹 프레임워크를 설계할 수 있는가?
  • RQ3완전한 몬테카를로 시뮬레이션 없이도 '마지지에서 첫 번째로 자원 할당' 전략을 통해 순위 기반 경계 영향력 확산을 효율적으로 추정할 수 있는가?
  • RQ4실제 네트워크에서 기존 최고 수준의 게리프 및 휴리스틱 알고리즘과 비교해 IMRank의 정확성과 속도는 어떠한가?
  • RQ5IMRank는 다양한 네트워크 구조와 영향력 모델에서 일관된 성능을 유지를 하는가?

주요 결과

  • IMRank는 게리프 알고리즘 수준의 영향력 확산 성능을 달성하면서도, 다른 스케일러블 휴리스틱보다 최대 100배 빠른 계산 비용을 기록한다.
  • EPINIONS 네트워크(500만 개 이상의 간선)에서 IMRank1은 IRIE보다 13배, PMIA보다 8배 더 빠르며, 유사하거나 더 높은 영향력 확산을 달성한다.
  • DOUBAN 네트워크(2200만 개 간선)에서 IMRank1은 PMIA보다 100배 이상 빠르고 IRIE보다 10배 더 빠르며, 비슷한 영향력 확산 성능을 보인다.
  • LIVEJOURNAL 네트워크(6900만 개 간선)에서 IMRank2는 PMIA와 IRIE보다 더 높은 영향력 확산을 달성하면서도 더 빠른 속도로 실행된다.
  • IMRank는 밀도 높은(EPINIONS, DOUBAN) 및 희박한(_PHY, DBLP) 그래프를 포함한 다양한 네트워크에서 일관되게 PMIA와 IRIE를 능가하며 안정적인 성능을 보인다.
  • WIC 모델 하에서 EPINIONS에서 IMRank1은 PMIA의 0.1%와 IRIE의 5%의 시간에 실행되며, 비슷하거나 더 높은 영향력 확산 성능을 기록한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.