Skip to main content
QUICK REVIEW

[論文レビュー] Kronecker Graphs: An Approach to Modeling Networks

Jure Leskovec, Deepayan Chakrabarti|ArXiv.org|Dec 29, 2008
Complex Network Analysis Techniques参考文献 85被引用数 736
ひとこと要約

本稿では、Kronecker積を用いて現実の構造的性質——重尾度分布、小さな直径、時間経過による密着化——を自然に再現する生成的ネットワークモデル「Kroneckerグラフ」を紹介する。主な貢献は、最大尤度推定を用いて実ネットワークにモデルを適合させる線形時間アルゴリズム「KronFit」であり、4つのパラメータでのみ、スケーラブルかつ高精度な合成グラフ生成を可能にする。

ABSTRACT

How can we model networks with a mathematically tractable model that allows for rigorous analysis of network properties? Networks exhibit a long list of surprising properties: heavy tails for the degree distribution; small diameters; and densification and shrinking diameters over time. Most present network models either fail to match several of the above properties, are complicated to analyze mathematically, or both. In this paper we propose a generative model for networks that is both mathematically tractable and can generate networks that have the above mentioned properties. Our main idea is to use the Kronecker product to generate graphs that we refer to as "Kronecker graphs". First, we prove that Kronecker graphs naturally obey common network properties. We also provide empirical evidence showing that Kronecker graphs can effectively model the structure of real networks. We then present KronFit, a fast and scalable algorithm for fitting the Kronecker graph generation model to large real networks. A naive approach to fitting would take super- exponential time. In contrast, KronFit takes linear time, by exploiting the structure of Kronecker matrix multiplication and by using statistical simulation techniques. Experiments on large real and synthetic networks show that KronFit finds accurate parameters that indeed very well mimic the properties of target networks. Once fitted, the model parameters can be used to gain insights about the network structure, and the resulting synthetic graphs can be used for null- models, anonymization, extrapolations, and graph summarization.

研究の動機と目的

  • 現実のネットワークに見られる主な静的および時間的性質を自然に再現できる、数学的に取り扱いやすいネットワークモデルの開発。
  • 既存モデルがネットワークの性質を正確に再現できない、あるいは解析的厳密性に欠けるという限界を是正すること。
  • 原理的統計推定に基づき、大規模な実ネットワークにモデルを適合させるスケーラブルで効率的なアルゴリズムの設計。
  • ネットワークの外挿、匿名化、ノイズモデル生成、構造解析のための実用的応用を、合成グラフ生成によって可能にすること。

提案手法

  • モデルは、小さな初期行列のKronecker積を再帰的に展開することで、大規模な合成グラフを生成する。
  • Kronecker積の構造により、重尾度分布や固有値分布といった主要なネットワーク性質が、演算の代数的性質から自然に出現する。
  • KronFitは最大尤度原理を用いて、実ネットワークからの初期行列パラメータを推定し、Metropolisサンプリングによるノード対応の必要を回避する。
  • アルゴリズムはKronecker行列の再帰的構造を活用し、尤度計算を線形時間で行うことで、単純な適合法の超指数的計算量を回避する。
  • 統計的シミュレーション技術と行列のスパarsityを活用し、数百万ノードに達する規模のネットワークにもスケーリング可能である。
  • 初期行列に他のパラメトリック分布(例:指数分布や多項分布)を組み込むことで、重み付きおよびラベル付きネットワークへの拡張が可能となる。

実験結果

リサーチクエスチョン

  • RQ1Kronecker行列積に基づく生成的モデルは、実ネットワークで観察される構造的および時間的性質を自然に再現できるか?
  • RQ2このようなモデルのパラメータを、大規模な実世界ネットワークに対して効率的かつスケーラブルに推定することは可能か?
  • RQ3得られた合成グラフは、正確なノイズモデルや実ネットワークの匿名化表現として機能できるか?
  • RQ4Kroneckerモデルの推定パラメータは、実ネットワークのグローバル構造およびコミュニティ構造をどのように反映しているか?

主な発見

  • Kroneckerグラフは、重尾入次数および出次数分布、小さく減少する直径、時間経過による密着化を自然に示し、実ネットワークの経験的観察と一致する。
  • Kronecker行列乗算の理論が整備されているため、ネットワーク性質に関する厳密な数学的証明が可能となる。
  • KronFitはエッジ数に比例する線形時間でモデルパラメータを推定でき、従来手法(例:クラスタ上で20分対2日)と比べて数桁速い。
  • 4つのパラメータのみで、度数分布、固有値分布、有効直径といった複数のグローバルネットワーク性質を正確に再現可能である。
  • 適合されたモデルにより、ネットワークの外挿、匿名化、予測といった実用的応用が可能となり、合成グラフは実ネットワークの統計と密接に一致する。
  • 初期行列にベルヌーイ分布以外の分布を組み込むことで、重み付きおよびラベル付きネットワークへの一般化が可能となる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。