QUICK REVIEW

[論文レビュー] IMRank: Influence Maximization via Finding Self-Consistent Ranking

Suqi Cheng, Huawei Shen|arXiv (Cornell University)|Feb 17, 2014

Spam and Phishing Detection参考文献 22被引用数 29

ひとこと要約

IMRank は、ノードのランクがそのランクに基づくマージナルインフルエンススプレッドと一致する自己整合的ランク付けに収束することで、インフルエンス最大化問題を効率的に解く反復的ランク付けフレームワークである。最後から最初への割り当て戦略を活用し、次数や強さなどの任意の初期ランクから出発することで、ヒューリスティックレベルの効率性とグリーディレベルの精度を実現し、大規模ネットワークにおいて、他の最先端手法と比較して最大100倍の高速化を達成しながらも、高いインフルエンススプレッドを維持する。

ABSTRACT

Influence maximization, fundamental for word-of-mouth marketing and viral marketing, aims to find a set of seed nodes maximizing influence spread on social network. Early methods mainly fall into two paradigms with certain benefits and drawbacks: (1)Greedy algorithms, selecting seed nodes one by one, give a guaranteed accuracy relying on the accurate approximation of influence spread with high computational cost; (2)Heuristic algorithms, estimating influence spread using efficient heuristics, have low computational cost but unstable accuracy. We first point out that greedy algorithms are essentially finding a self-consistent ranking, where nodes' ranks are consistent with their ranking-based marginal influence spread. This insight motivates us to develop an iterative ranking framework, i.e., IMRank, to efficiently solve influence maximization problem under independent cascade model. Starting from an initial ranking, e.g., one obtained from efficient heuristic algorithm, IMRank finds a self-consistent ranking by reordering nodes iteratively in terms of their ranking-based marginal influence spread computed according to current ranking. We also prove that IMRank definitely converges to a self-consistent ranking starting from any initial ranking. Furthermore, within this framework, a last-to-first allocating strategy and a generalization of this strategy are proposed to improve the efficiency of estimating ranking-based marginal influence spread for a given ranking. In this way, IMRank achieves both remarkable efficiency and high accuracy by leveraging simultaneously the benefits of greedy algorithms and heuristic algorithms. As demonstrated by extensive experiments on large scale real-world social networks, IMRank always achieves high accuracy comparable to greedy algorithms, with computational cost reduced dramatically, even about $10-100$ times faster than other scalable heuristics.

研究の動機と目的

大規模なソーシャルネットワークにおけるインフルエンス最大化の精度と効率のトレードオフを解消すること。
問題をノードの自己整合的ランク付けとして定式化することで、シード選定とインフルエンススプレッド推定を統合すること。
任意の初期ランクから出発しても保証された収束を示す反復的フレームワークを構築すること。
再計算から完全に再計算せずに、ランクに基づくマージナルインフルエンススプレッドを効率的に推定する戦略を設計すること。
実世界の応用において、高精度（グリーディアルゴリズムと同等）かつ高スケーラビリティ（既存のヒューリスティクスを上回る）を両立させること。

提案手法

IMRank は、ノードのランクがそのランクに基づくマージナルインフルエンススプレッドと一致する自己整合的ランク付けに収束する反復的プロセスとしてインフルエンス最大化を定式化する。
次数や強さなどの初期ランクから出発し、ノードを現在のランクに基づくマージナルインフルエンススプレッドに従って再順序付けする。
独立キャスケードモデルの構造を活用し、最も低いランクのノードから逆方向にインフルエンスを伝搬することで、効率的なマージナルインフルエンススプレッド推定を実現する「最後から最初への割り当て戦略」を導入する。
推定精度を向上させつつ計算効率を維持するために、この戦略を一般化する。
理論的分析により、任意の初期ランクから出発しても、有限ステップ内で自己整合的ランク付けに収束することを証明する。
反復処理間でインフルエンススプレッド計算を再利用することで、グリーディの精度とヒューリスティクスの効率性を統合する。

実験結果

リサーチクエスチョン

RQ1インフルエンス最大化を、精度と効率のバランスを取るために、自己整合的ランク付け問題として再定式化できるか？
RQ2任意の初期ランクから出発しても、安定的かつ最適なランク付けに収束する反復的ランク付けフレームワークは構築可能か？
RQ3完全なモンテカルロシミュレーションなしに、最後から最初への割り当て戦略でランクに基づくマージナルインフルエンススプレッドを効率的に推定できるか？
RQ4実世界のネットワークにおいて、IMRank は最先端のグリーディおよびヒューリスティクスアルゴリズムと比較して、精度と速度の両面で優れているか？
RQ5IMRank は、多様なネットワークトポロジーとインフルエンスモデルにおいて一貫したパフォーマンスを発揮するか？

主な発見

IMRank は、グリーディアルゴリズムと同等のインフルエンススプレッドを達成し、他のスケーラブルなヒューリスティクスと比較して計算コストを最大100倍まで削減する。
EPINIONS ネットワーク（500k以上のエッジ）では、IMRank1 は IRIE より13倍速く、PMIA より8倍速く、同程度またはより高いインフルエンススプレッドを達成する。
DOUBAN ネットワーク（2200万エッジ）では、IMRank1 は PMIA より100倍以上速く、IRIE より10倍速く、同程度のインフルエンススプレッドを達成する。
LIVEJOURNAL ネットワーク（6900万エッジ）では、IMRank2 は PMIA や IRIE より高いインフルエンススプレッドを達成し、両者よりも高速に動作する。
IMRank は、密な（EPINIONS, DOUBAN）および疎な（PHY, DBLP）グラフを含む多様なネットワークで、PMIA や IRIE を一貫して上回り、安定したパフォーマンスを示す。
WIC モデル下で EPINIONS において、IMRank1 は PMIA の0.1%の時間で実行され、IRIE の5%の時間で実行され、同程度またはより高いインフルエンススプレッドを達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。