Skip to main content
QUICK REVIEW

[論文レビュー] Fast triangle counting through wedge sampling.

C. Seshadhri, Ali Pınar|arXiv (Cornell University)|Aug 1, 2012
Complex Network Analysis Techniques参考文献 28被引用数 33
ひとこと要約

本稿では、グラフサイズに依存しない相対誤差を達成するための、楔抽出に基づく新規なサンプリング手法を提案する。この手法は、無向および有向グラフにおける高速な三角形カウントを実現し、従来の近似手法よりも実用的に顕著に優れた性能を発揮する。また、無向グラフにおける同種の手法としては初めてである。

ABSTRACT

Graphs and networks are used to model interactions in a variety of contexts, and there is a growing need to be able to quickly assess the qualities of a graph in order to understand its underlying structure. Some of the most useful metrics are triangle based and give a measure of the connectedness of “friends of friends. ” Counting the number of triangles in a graph has, therefore, received considerable attention in recent years. We propose new sampling-based methods for counting the number of triangles or the number of triangles with vertices of specified degree in an undirected graph and for counting the number of each type of directed triangle in a directed graph. The number of samples depends only on the desired relative accuracy and not on the size of the graph. We present extensive numerical results showing that our methods are often much better than the error bounds would suggest. In the undirected case, our method is generally superior to other approximation approaches; in the undirected case, ours is the first approximation method proposed.

研究の動機と目的

  • 大規模ネットワークにおける効率的なグラフ解析の増大するニーズに対応し、大規模ネットワークにおける三角形の高速かつ正確なカウントを可能にすること。
  • グラフサイズに比例しない相対誤差を達成するサンプリングベースのアプローチを開発すること。
  • 理論的性能保証を備えた、無向グラフの三角形カウントのための最初の近似手法を提供すること。
  • 有向グラフにおける三角形および無向グラフにおける頂点の次数ごとの三角形をカウントするようにこの手法を拡張すること。

提案手法

  • 共通の頂点を共有するエッジのペア(楔)をサンプリングし、統計的推論を用いて三角形の数を推定する。
  • 各サンプルされた楔は、第三のエッジが三角形を完成させるかどうかに基づき、三角形の形成確率を推定する。
  • 楔と三角形の関係を活用する:三角形は3つの楔を含み、楔の数は三角形の数に比例する。
  • 有向グラフでは、方向制約を用いた楔サンプリングにより、異なる種類の有向三角形(例:サイクル型 vs. 非サイクル型)を区別する。
  • 必要となるサンプル数はグラフサイズに依存せず、望ましい相対誤差にのみ依存するため、スケーラビリティが保証される。

実験結果

リサーチクエスチョン

  • RQ1大規模グラフにおける三角形カウントを、精度を維持したまま、サンプリングを用いてどのように高速化できるか?
  • RQ2無向グラフの三角形カウントにおいて、グラフサイズに依存しない相対誤差を達成できるサンプリング手法は存在するか?
  • RQ3実用的に、楔サンプリングは既存の近似手法と比較してどのように性能を発揮するか?
  • RQ4この手法は、異なる種類の有向三角形をカウントするために拡張可能か?

主な発見

  • 提案手法は理論的誤差境界が示唆するよりも実用的に顕著に優れた性能を発揮し、しばしば他の近似手法を上回る。
  • 必要なサンプル数はグラフサイズに依存せず、望ましい相対誤差にのみ依存するため、大規模ネットワークにおける効率的な計算が可能になる。
  • 無向グラフにおいて、本手法は、スケーラビリティと正確性の新しいベンチマークを提供する、最初の近似ベースのアプローチである。
  • 広範な数値実験の結果、本手法は多様なグラフタイプおよびサイズにおいて、強固で効率的であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。