Skip to main content
QUICK REVIEW

[論文レビュー] Influence Maximization in Continuous Time Diffusion Networks

Manuel Gomez-Rodriguez, Bernhard Sch lkopf|arXiv (Cornell University)|May 8, 2012
Complex Network Analysis Techniques参考文献 26被引用数 102
ひとこと要約

本稿では、ノード間の非一様な伝播レートを考慮した連続時間拡散ネットワークにおける影響力最大化のためのアルゴリズム、InfluMaxを提案する。拡散を連続時間マーカフ過程としてモデル化し、確率的最短経路を用いた解析的影響計算を活用することで、最先端の手法に比べ20–30%の性能向上を達成し、特に短い時間枠において顕著な効果を示す。また、近似保証が保証され、ラージ評価と局所的探索を用いた効率的な計算が可能である。

ABSTRACT

The problem of finding the optimal set of source nodes in a diffusion network that maximizes the spread of information, influence, and diseases in a limited amount of time depends dramatically on the underlying temporal dynamics of the network. However, this still remains largely unexplored to date. To this end, given a network and its temporal dynamics, we first describe how continuous time Markov chains allow us to analytically compute the average total number of nodes reached by a diffusion process starting in a set of source nodes. We then show that selecting the set of most influential source nodes in the continuous time influence maximization problem is NP-hard and develop an efficient approximation algorithm with provable near-optimal performance. Experiments on synthetic and real diffusion networks show that our algorithm outperforms other state of the art algorithms by at least ~20% and is robust across different network topologies.

研究の動機と目的

  • 拡散ネットワークにおける非一様で時間変動する伝播レートを組み込むことで、影響力最大化研究におけるギャップを埋めること。
  • モンテカルロシミュレーションやヒューリスティクスに依存せずに、連続時間における影響力拡散を効率的かつ解析的に計算する手法を開発すること。
  • 連続時間ダイナミクス下での影響力最大化問題に対して、証明可能な近似最適解を提供するアルゴリズムを設計すること。
  • MemeTrackerデータから推定された実世界の拡散ネットワークと、非一様なダイナミクスを有する合成ネットワークの両方で、手法を評価すること。

提案手法

  • エッジ固有の伝播レートを有する連続時間マーカフ過程として情報拡散をモデル化し、現実的な時間的ダイナミクスを実現する。
  • Kulkarni (1986) が提唱した確率的最短経路フレームワークを用い、特定のソース集合からの感染ノードの期待数を解析的に計算する。
  • 影響関数の下流性(submodularity)を活用し、理論的性能保証を備えたグリーディ近似アルゴリズムを設計する。
  • ラージ評価と局所的ソースノード探索(ホップ制限 m=6)を用いて計算を高速化し、影響力の正確さを10%以内に維持する。
  • シンクノードとソースノードごとに自然に並列化可能であり、大規模ネットワークにおけるスケーラブルな計算を可能にする。
  • スケーラビリティ向上のため、最も速い1,000本のエッジのみを保持するようにネットワークをスパース化するが、精度の著しい損失は生じない。

実験結果

リサーチクエスチョン

  • RQ1伝播レートがエッジごとに異なる状況下で、連続時間拡散ネットワークにおける影響力拡散を解析的に計算できるか?
  • RQ2連続時間かつ非一様レートのダイナミクス下で、影響力最大化問題はNP困難であり得るか。また、証明可能な保証を伴う近似が可能か?
  • RQ3時間的ダイナミクスを考慮することで、離散時間モデルや均一レートモデルと比較して、影響力拡散がどの程度向上するか?
  • RQ4局所的探索とエッジスパース化を用いる際の、計算効率と影響力正確さのトレードオフはいかなるものか?

主な発見

  • 非一様な時間的ダイナミクスを有する合成ネットワークにおいて、InfluMaxは最先端手法に比べて最低20%の性能向上を達成し、特に短い時間枠で顕著な向上が観察された。
  • MemeTrackerハイパーリンクカスケードから推定された実世界の拡散ネットワークにおいて、InfluMaxは既存手法に比べ影響力拡散で30%の向上を達成した。
  • 2,048ノードのネットワークにおいて、m=6ホップの局所的探索を用いることで5倍の高速化が達成され、影響力近似誤差は最大10%に抑えられた。
  • 影響関数は下流性を示すため、理論的近似保証を備えたグリーディ近似アルゴリズムの適用が可能である。
  • モンテカルロシミュレーションやヒューリスティクスを回避する解析的影響計算により、大幅な効率性と正確性の向上が達成された。
  • 本手法は多様なネットワークトポロジに強く、さまざまな時間枠やソース集合サイズの変動に対しても安定した性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。