Skip to main content
QUICK REVIEW

[論文レビュー] COEVOLVE: A Joint Point Process Model for Information Diffusion and Network Co-evolution

Mehrdad Farajtabar, Yichen Wang|arXiv (Cornell University)|Jul 8, 2015
Complex Network Analysis Techniques参考文献 31被引用数 95
ひとこと要約

COEVOLVEは、オンラインソーシャルネットワークにおける情報拡散とネットワークの共進化を jointly にモデル化する共同時系列点過程モデルを提案する。リツイートには多次元ハーケス過程を、リンク作成には情報駆動型の生存過程を用い、両者の間で双方向的影響を表現する。本モデルは効率的なシミュレーションと凸最適化によるパラメータ学習を可能とし、実際のTwitterデータ上でのリツイートおよびリンクイベントの予測において、ベースラインを上回る性能を発揮する。

ABSTRACT

Information diffusion in online social networks is affected by the underlying network topology, but it also has the power to change it. Online users are constantly creating new links when exposed to new information sources, and in turn these links are alternating the way information spreads. However, these two highly intertwined stochastic processes, information diffusion and network evolution, have been predominantly studied separately, ignoring their co-evolutionary dynamics. We propose a temporal point process model, COEVOLVE, for such joint dynamics, allowing the intensity of one process to be modulated by that of the other. This model allows us to efficiently simulate interleaved diffusion and network events, and generate traces obeying common diffusion and network patterns observed in real-world networks. Furthermore, we also develop a convex optimization framework to learn the parameters of the model from historical diffusion and network evolution traces. We experimented with both synthetic data and data gathered from Twitter, and show that our model provides a good fit to the data as well as more accurate predictions than alternatives.

研究の動機と目的

  • オンラインソーシャルネットワークにおける情報拡散とネットワーク進化の間の双方向的影響をモデル化すること。
  • リツイートが新しいリンク形成を引き起こし、逆にリンク形成がリツイートに影響を与えるという相互作用を捉える共同確率枠組みを構築すること。
  • 実世界のイベントトレースから、効率的なシミュレーションとパラメータ学習を可能にすること。
  • プロセスを別々に扱うモデルと比較して、リツイートおよびリンクイベントの両方の予測精度を向上させること。
  • 合成データおよび大規模なTwitterデータセットを用いたモデルの妥当性を検証し、現実のパターンに忠実であることを示すこと。

提案手法

  • 各リツイートの強度が送信元の識別子と影響力に依存する、識別子を明らかにする励起を持つ多次元ハーケス過程を用いてリツイートイベントをモデル化する。
  • リンク作成をリツイート強度によって駆動される生存過程としてモデル化し、特に活発な情報ソースに向けて新しいリンクが優先的に形成されることを表現する。
  • Ogataのアルゴリズムを用いて効率的なイベントサンプリングを実現し、スパarsityに配慮したサンプリングにより、O(nd log m)の複雑度を達成する。
  • 観測された拡散およびネットワーク進化イベントの同時尤度を最大化することで、凸最適化を用いてモデルパラメータを学習する。
  • 時間的に変化する影響力と非均一なトリガー核を組み合わせて、微細な時間的ダイナミクスを捉える。
  • 連続時間における情報拡散とネットワークイベントの混合シミュレーションを実現するため、リジェクションサンプリングフレームワークを用いる。

実験結果

リサーチクエスチョン

  • RQ1オンラインソーシャルネットワークにおける情報拡散とネットワーク構造形成の共進化をどのようにモデル化できるか?
  • RQ2リツイートイベントが新しいソーシャルリンクの形成に与える影響は何か?
  • RQ3分離モデルと比較して、共同モデルがリツイートおよびリンクイベントの両方の予測精度を向上させられるか?
  • RQ4このような共進化システムのシミュレーションとパラメータ学習は、どの程度効率的に可能か?
  • RQ5本モデルは、キャスケード構造、ノード次数、ネットワーク径などの現実のパターンをどの程度正確に再現できるか?

主な発見

  • COEVOLVEモデルは、情報拡散とネットワーク進化の間の双方向的影響を効果的に捉えており、特に影響力のあるソースに向けてリツイートが新しいリンク形成を促進することが明らかになった。
  • 本モデルは、現実のパターン(キャスケードサイズ、深さ、ノード次数分布、縮小するネットワーク径)に極めて近い合成データを生成できる。
  • 凸最適化によるパラメータ学習により、効率的かつスケーラブルな推論が可能となり、大規模なTwitterデータセットへの適用が可能になった。
  • 実際のTwitterデータ上でのリツイートおよびリンクイベントの予測において、本モデルはベースラインモデルを著しく上回る予測精度を示した。
  • サンプリング手順の計算量はO(nd log m)と評価され、現実のネットワークにおける大規模な共進化ダイナミクスのシミュレーションが現実可能となった。
  • 本モデルはリツイートにおける送信元識別子の特定を可能としており、影響力伝播およびリンク標的指定のより正確なモデル化を実現した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。