QUICK REVIEW

[論文レビュー] Graph Summarization Methods and Applications: A Survey

Yike Liu, Tara Safavi|arXiv (Cornell University)|Dec 14, 2016

Graph Theory and Algorithms参考文献 170被引用数 73

ひとこと要約

本サーベイは、入力グラフの種別とコアな手法に基づいて分類する、グラフ要約手法の包括的な分類法を提示する。構造的および意味的性質を保持したままグラフのサイズを縮小する技術をレビューし、大規模ネットワークにおける効率的な分析、可視化、ノイズ低減を可能にする。

ABSTRACT

While advances in computing resources have made processing enormous amounts of data possible, human ability to identify patterns in such data has not scaled accordingly. Efficient computational methods for condensing and simplifying data are thus becoming vital for extracting actionable insights. In particular, while data summarization techniques have been studied extensively, only recently has summarizing interconnected data, or graphs, become popular. This survey is a structured, comprehensive overview of the state-of-the-art methods for summarizing graph data. We first broach the motivation behind, and the challenges of, graph summarization. We then categorize summarization approaches by the type of graphs taken as input and further organize each category by core methodology. Finally, we discuss applications of summarization on real-world graphs and conclude by describing some open problems in the field.

研究の動機と目的

大規模かつ相互接続されたデータの効率的分析の増大するニーズに対応するため、グラフ構造情報の要約を行う。
データ量、意味的異種性、標準化された評価の欠如といった、グラフ要約における主な課題を特定する。
入力グラフの種別（例：静的、動的、属性付き、マルチレイヤー）およびコアな技術（例：クラスタリング、因子分解、抽象化）に基づいて、既存の要約手法を分類する。
アルゴリズム的アプローチの構造的概要を提供し、実世界の応用と関連付ける。
時間的、属性付き、マルチビューのグラフを含む複雑なデータタイプの処理における未解決問題、および評価指標の標準化の重要性を強調する。

提案手法

入力グラフの種別（静的、動的、属性付き、マルチレイヤー、マルチビュー）に基づいて、グラフ要約手法を分類する。
各カテゴリ内では、コアな技術（クラスタリングベース、因子分解ベース、抽象化ベース、クエリ指向）に応じて手法を整理する。
分類法を用いて、ノードのグループ化（モジュラリティやコミュニティ検出を用いた）といった、アルゴリズム的アプローチの根拠をマッピングする。
データマイニング、データベースシステム、可視化の知見を統合し、手法の選定と評価を支援する。
スパarsity、情報損失、可視化可能性といった評価基準を提案し、異なる手法間での要約品質の比較を可能にする。
グラフニューラルネットワークを用いて学習された深層ノード表現を活用した、新たな方向性を検討する。

実験結果

リサーチクエスチョン

RQ1どのようにしてグラフ要約技術が、主要な構造的および意味的性質を保持したまま大規模グラフのサイズを効果的に縮小できるか？
RQ2グラフ要約における支配的であるとされる手法ファミリーは何か？それらは仮定や応用においてどのように異なるか？
RQ3既存の手法は、動的、属性付き、マルチレイヤー、またはマルチビューのグラフといった多様なグラフタイプをどのように処理しているか？
RQ4要約手法を比較する際に最も適切な評価指標は何か？そして、標準化が再現性およびベンチマークの向上にどのように寄与できるか？
RQ5深層学習ベースのノード表現は、要約の品質および一般化能力をどの程度向上させることができるか？

主な発見

グラフ要約によりデータ量を顕著に削減可能である。例えば、20億ユーザーを有するFacebookのグラフは、ストレージおよびI/Oコストを削減するために要約可能である。
要約されたグラフは、グラフアルゴリズムやクエリの実行を高速化し、そうでなければ非効率的・非現実的である大規模ネットワークの分析を可能にする。
要約により、メモリ制限のある環境でも、もはや扱えない「ヘアボール」グラフのインタラクティブな分析と可視化が可能になる。
実世界のグラフに含まれるノイズは要約によってフィルタリングされ、信号検出の精度が向上し、処理のオーバーヘッドが低減される。
既存の手法は複雑なグラフタイプに対するサポートが限定的である。時間的属性付きグラフやマルチレイヤー／マルチビューのネットワークを要約する包括的な研究は存在しない。
評価指標は依然としてアプリケーションに強く依存している。公平な比較のためには、スパarsity、情報損失、可視化可能性といった標準化された指標の導入が不可欠である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。