Skip to main content
QUICK REVIEW

[論文レビュー] Dynamic Partition of Complex Networks

Lin F. Yang, Vladimir Braverman|arXiv (Cornell University)|May 22, 2017
Human Mobility and Location-Based Analysis被引用数 2
ひとこと要約

本稿では、ランダムウォーク観測を用いて大規模で暗黙的(implicit)なネットワークのオンラインかつスケーラブルな要因分解および分割を実現する確率的一般化ヘブシアンアルゴリズムを提案する。この手法は、下位のマルコフ過程が lumpable(要約可能)である場合に、ネットワークの分割を正確に回復可能な低次元の頂点表現を学習する。実際のマンハッタンタクシーのデータを用いた実験により、交通流に整合する都市の分割を同定した。

ABSTRACT

Finding the reduced-dimensional structure is critical to understanding complex networks. Existing approaches such as spectral clustering are applicable only when the full network is explicitly observed. In this paper, we focus on the online factorization and partition of implicit large-scale networks based on observations from an associated random walk. We formulate this into a nonconvex stochastic factorization problem and propose an efficient and scalable stochastic generalized Hebbian algorithm. The algorithm is able to process dependent state-transition data dynamically generated by the underlying network and learn a low-dimensional representation for each vertex. By applying a diffusion approximation analysis, we show that the continuous-time limiting process of the stochastic algorithm converges globally to the principal components of the Markov chain and achieves a nearly optimal sample complexity. Once given the learned low-dimensional representations, we further apply clustering techniques to recover the network partition. We show that when the associated Markov process is lumpable, one can recover the partition exactly with high probability. We apply the proposed approach to model the traffic flow of Manhattan as city-wide random walks. By using our algorithm to analyze the taxi trip data, we discover a latent partition of the Manhattan city that closely matches the traffic dynamics.

研究の動機と目的

  • ランダムウォークからの部分的で相関のある観測しか得られない大規模ネットワークにおける低次元表現の学習という課題に取り組む。
  • ネットワークの完全な観測が不要な、オンラインでスケーラブルな要因分解および分割手法を開発する。
  • ほぼ最適なサンプル複雑性を達成しつつ、下位のマルコフ連鎖の主成分へグローバルに収束することを実現する。
  • 関連するマルコフ過程が lumpable である場合に、ネットワークの分割を正確に回復できることを実現する。
  • 都市交通の流れのような実世界のシステムにおける隠れた構造的分割をモデル化・同定することを目的とする。

提案手法

  • ランダムウォークからの相関のある状態遷移データに基づき、ネットワーク要因分解問題を非凸な確率的最適化問題として定式化する。
  • ストリーミング遷移データを用いて、反復的に低次元の頂点表現を更新するための確率的一般化ヘブシアンアルゴリズムを採用する。
  • 拡散近似を適用することで、アルゴリズムの連続時間極限がマルコフ連鎖の主成分へグローバルに収束することを示す。
  • 学習された低次元表現に対するクラスタリングを適用し、ネットワークの隠れた分割構造を回復する。
  • マルコフ過程の lumpability 性質に依存することで、高い確率で正確な分割回復を保証する。
  • マンハッタンの都市全体の交通ダイナミクスをモデル化するために、実際のタクシー移動データを用いて手法を検証する。

実験結果

リサーチクエスチョン

  • RQ1ストリーミングで相関のある観測(ランダムウォーク)から、大規模ネットワークの低次元表現を学習することは可能か?
  • RQ2提案された確率的アルゴリズムは、下位のマルコフ連鎖の主成分へグローバルに収束するか?
  • RQ3アルゴリズムのサンプル複雑性は何か? これは最適に近いか?
  • RQ4どのような条件下で、学習済み表現からネットワークの分割を正確に回復できるか?
  • RQ5この手法は、都市交通ネットワークのような複雑なシステムにおいて、意味のある実世界の分割を発見できるか?

主な発見

  • 確率的一般化ヘブシアンアルゴリズムは、連続時間極限において、マルコフ連鎖の主成分へグローバルに収束する。
  • 拡散近似解析を通じて、アルゴリズムがほぼ最適なサンプル複雑性を達成することが示された。
  • 下位のマルコフ過程が lumpable である場合、高い確率で真のネットワーク分割を正確に回復できる。
  • 学習された低次元表現は、マンハッタンの交通ネットワークにおける隠れたコミュニティ構造を的確に捉えている。
  • 実際のタクシー移動データを用いた検証により、同定された分割が実際の交通ダイナミクスとよく一致していることが確認された。
  • 本手法により、ネットワークの完全な観測が不要なスケーラブルでオンラインの暗黙的ネットワーク解析が可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。