Skip to main content
QUICK REVIEW

[論文レビュー] Bootstrapping Networks with Latent Space Structure

Keith Levin, Elizaveta Levina|arXiv (Cornell University)|Jul 25, 2019
Graph Theory and Algorithms参考文献 51被引用数 25
ひとこと要約

本稿では、特にランダムドット積集合グラフ(RDPG)を想定した潜在空間モデル下でのネットワークデータに対する2つのブートストラップ手法を提案する。1つ目の手法は、推定された潜在位置のU統計量を、既知のU統計量理論を用いてブートストラップ処理し、部分グラフカウントや中心性指標の効率的推論を可能にする。2つ目の手法は、潜在位置を再サンプリングし、再びエッジを再シミュレーションすることで完全なブートストラップネットワークを生成する。両手法とも、RDPGの仮定下で漸近的に分布的一致性を示しており、U統計量アプローチは計算上の利点を有する。

ABSTRACT

A core problem in statistical network analysis is to develop network analogues of classical techniques. The problem of bootstrapping network data stands out as especially challenging, since typically one observes only a single network, rather than a sample. Here we propose two methods for obtaining bootstrap samples for networks drawn from latent space models. The first method generates bootstrap replicates of network statistics that can be represented as U-statistics in the latent positions, and avoids actually constructing new bootstrapped networks. The second method generates bootstrap replicates of whole networks, and thus can be used for bootstrapping any network function. Commonly studied network quantities that can be represented as U-statistics include many popular summaries, such as average degree and subgraph counts, but other equally popular summaries, such as the clustering coefficient, are not expressible as U-statistics and thus require the second bootstrap method. Under the assumption of a random dot product graph, a type of latent space network model, we show consistency of the proposed bootstrap methods. We give motivating examples throughout and demonstrate the effectiveness of our methods on synthetic data.

研究の動機と目的

  • 単一のネットワークしか観測できない状況におけるネットワーク推論の課題に対処すること。これはネットワーク推論において一般的な制限である。
  • 潜在位置のU統計量として表現可能なネットワーク統計量のための、計算効率の良いブートストラップ手法を開発すること。これにより、完全なネットワークの再シミュレーションを回避できる。
  • RDPGモデル下で、完全なネットワークのブートストラップ再現を生成する手法を提供することにより、ネットワーク推論における応用範囲を拡大すること。
  • ランダムドット積集合グラフモデル下で、両ブートストラップ手法の理論的一貫性を確立すること。
  • 潜在空間構造と既知のU統計量理論を活用することで、従来の部分グラフカウントのブートストラップ技術を改善すること。

提案手法

  • 1つ目の手法は、スペクトル法を用いて観測ネットワークから潜在位置を推定し、その推定値のU統計量に対して標準的なブートストラップ手法を適用する。
  • 2つ目の手法は、推定された潜在位置を復元抽出で再サンプリングし、RDPGのエッジ確率モデルを用いて新しい隣接行列を生成し、完全なブートストラップネットワークを生成する。
  • U統計量およびV統計量のブートストラップ理論(例:Arcones & Giné, 1992)の結果を用いて、RDPGモデル下で理論的一致性を確立する。
  • ブートストラップネットワークと元のネットワークの分布的一致性を示すために、グラフマッチング距離を導入する。
  • 合成データを用いて手法を検証し、部分グラフカウントの信頼区間のカバレッジレートを、さまざまなブートストラップ手法間で比較する。
  • カバレッジを改善するための補正法(BCa)を検討したが、計算コストが依然として懸念事項である。

実験結果

リサーチクエスチョン

  • RQ1潜在位置のU統計量として表現可能なネットワーク統計量のための、計算効率の良いブートストラップ手法を開発できるか?
  • RQ2RDPGモデル下で、元のネットワークと漸近的に分布的に同等となる完全なネットワークのブートストラップ再現を生成できるか?
  • RQ3提案手法のカバレッジ精度は、従来の手法(例:経験的グラフンや部分グラフサンプリング)と比較してどうなるか?
  • RQ4グラフマッチング距離は、ブートストラップネットワークの漸近的同等性を確立するために果たす役割は何か?
  • RQ5提案手法は、RDPGモデルを超えて他の潜在空間モデルへ拡張可能か?

主な発見

  • U統計量ブートストラップ手法は、完全なネットワークの再シミュレーションを回避し、潜在位置の再サンプリングと既知のU統計量ブートストラップ理論の適用により、計算効率を達成する。
  • 完全なネットワークブートストラップ手法は、RDPGモデル下でグラフマッチング距離で測定した場合、元のネットワークと漸近的に分布的に同等となる。
  • 実証的結果から、両提案手法が従来手法よりカバレッジレートを向上させることを示し、パラメトリックブートストラップ(正しいモデル知識を仮定)の性能を密接に再現している。
  • RDPGブートストラップは、ネットワークサイズが大きくなるほど、経験的グラフンや部分グラフサンプリング手法を上回るカバレッジ精度を示す。
  • BCa補正はカバレッジを改善するが、大規模ネットワークでは計算コストが非常に高いため、ネットワーク構造に配慮した補正が必要であると示唆される。
  • 理論的結果から、グラフマッチング距離での収束が、すべてのネットワーク統計量(例:部分グラフ密度)の収束を保証しないことが示唆されており、より強い類似性指標の必要性が示唆される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。