Skip to main content
QUICK REVIEW

[論文レビュー] Hitting and commute times in large graphs are often misleading

Ulrike von Luxburg, Agnes Radl|arXiv (Cornell University)|Mar 5, 2010
Advanced Graph Theory Research参考文献 52被引用数 29
ひとこと要約

本稿では、特にランダム幾何グラフや指定された期待次数を持つグラフにおいて、ヒット時間とコンmute時間( commute time )が、頂点の次数に依存する簡単な関数に収束することを示している。これは、グラフのグローバル構造を捉えるために有用でないことを意味する。グラフサイズが増大するにつれ、コンmute距離は $1/d_u + 1/d_v$ に近づき、クラスタ構造やトポロジーの情報に敏感でない局所的測度に帰着する。

ABSTRACT

Next to the shortest path distance, the second most popular distance function between vertices in a graph is the commute distance (resistance distance). For two vertices u and v, the hitting time H_{uv} is the expected time it takes a random walk to travel from u to v. The commute time is its symmetrized version C_{uv} = H_{uv} + H_{vu}. In our paper we study the behavior of hitting times and commute distances when the number n of vertices in the graph is very large. We prove that as n converges to infinty, hitting times and commute distances converge to expressions that do not take into account the global structure of the graph at all. Namely, the hitting time H_{uv} converges to 1/d_v and the commute time to 1/d_u + 1/d_v where d_u and d_v denote the degrees of vertices u and v. In these cases, the hitting and commute times are misleading in the sense that they do not provide information about the structure of the graph. We focus on two major classes of random graphs: random geometric graphs (k-nearest neighbor graphs, epsilon-graphs, Gaussian similarity graphs) and random graphs with given expected degrees (in particular, Erdos-Renyi graphs with and without planted partitions)

研究の動機と目的

  • 大規模なグラフにおけるヒット時間とコンmute時間の漸近的挙動を調査すること。
  • コンmute距離がグラフのクラスタ構造を効果的に符号化すると広く信じられている考えに挑戦すること。
  • 大規模なグラフにおいて、コンmute時間とヒット時間がグローバルなグラフトポロジーの感度を失うことを示すこと。
  • これらの距離が頂点の次数にのみ依存する式に収束することを確立すること、接続性やコミュニティ構造とは無関係であることを示すこと。

提案手法

  • グラフ上の電気回路理論とランダムウォークダイナミクスを用いて、ヒット時間とコンmute時間を分析すること。
  • 電気回路ネットワークに流れる電流に基づく議論を適用し、ヒット時間のタイトな上限を導出すること。
  • スペクトルグラフ理論を用いて、多様なランダムグラフモデルに一般化された結果を得ること。
  • ランダム幾何グラフにおけるk近傍半径の集中不等式を証明し、次数の変動を制御すること。
  • 大規模なグラフにおいて、kNN半径が $r \sim (k/n)^{1/d}$ のまわりに集中することを示し、次数の集中を導くこと。
  • 漸近的近似式を導出する:$H_{uv} \approx 1/d_v$ および $C_{uv} \approx 1/d_u + 1/d_v$ は、グラフサイズの増大に伴って成り立つ。

実験結果

リサーチクエスチョン

  • RQ1頂点数が無限大に近づくとき、ヒット時間とコンmute時間は大規模なランダムグラフでどのように振る舞うか?
  • RQ2コンmute距離は、大規模なグラフにおいて、クラスタリングやコミュニティ分割といったグローバル構造をどの程度反映するか?
  • RQ3コンmute距離が頂点の次数関数にのみ収束する条件は何か?
  • RQ4コモンなグラフ距離測度(例:コンmute距離)が大規模ネットワークにおいて構造的性質を捉えられないのはなぜか?

主な発見

  • 大規模なグラフにおいて、ヒット時間 $H_{uv}$ は $n \to \infty$ のとき、グローバルなグラフ構造にかかわらず $1/d_v$ に収束する。
  • コンmute時間 $C_{uv}$ は漸近的に $1/d_u + 1/d_v$ に近づき、2頂点の次数にのみ依存する。
  • ランダム幾何グラフ(kNN、εグラフ、ガウス類似度グラフ)において、$n \to \infty$ のとき、近似は高確率で成り立つ。
  • 期待次数が与えられたランダムグラフ(エッジ・レニー・モデルやプラント・パーティションモデルを含む)においても、最小次数が $n$ と共に増加する限り、同様の収束が成立する。
  • ランダム幾何グラフにおけるスぺクトルギャップは、高確率でゼロから離れているため、収束結果を支持する。
  • その結果、コンmute距離はクラスタリングタスクにおいて効果を失う。同様の次数を持つすべての頂点が、実際の接続性とは無関係に等しく近いと見なされるからである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。