Skip to main content
QUICK REVIEW

[論文レビュー] High Order Stochastic Graphlet Embedding for Graph-Based Pattern Recognition.

Anjan Dutta, Hichem Sahbi|arXiv (Cornell University)|Feb 1, 2017
Graph Theory and Algorithms参考文献 39被引用数 18
ひとこと要約

本稿では、高次確率的グラフレット埋め込み(SGE)を提案する。SGEは、大規模なグラフレットを確率的にサンプリングし、同型のグラフレットをハッシュ化することで、局所構造およびそれらの相互作用を明示的に高次元ベクトル空間に埋め込む手法である。SVMと組み合わせることで、ベンチマークデータセット全体でグラフ分類の精度が顕著に向上する。

ABSTRACT

Graph-based methods are known to be successful for pattern description and comparison purpose. However, a lot of mathematical tools are unavailable in graph domain, thus restricting the generic graph-based techniques to be applicable within the machine learning framework. A way to tackle this problem is graph embedding into high dimensional space in either an explicit or implicit manner. In this paper, we propose high order stochastic graphlet embedding (SGE) that explicitly embed a graph into a real vector space. Our main contribution includes a new stochastic search procedure that allows one to efficiently parse a given graph and extract or sample unlimitedly high order graphlets. We consider these graphlets with increasing size in order to model local features, as well as, their complex interactions. We also introduce or design graph hash functions with very low probability of collision to hash those sampled graphlets for partitioning them into sets of isomorphic ones and measure their distribution in large graph collections, which results in accurate graph descriptions. When combined with support vector machines, these high order graphlet-based descriptions have positive impact on the performance of graph-based pattern comparison and classification as corroborated through experiments on different standard benchmark databases.

研究の動機と目的

  • グラフドメインにおける数学的ツールの不足が、機械学習手法のグラフベースのパターン認識への応用を妨えている問題に対処する。
  • 既存のグラフ埋め込み手法の制限を克服し、グラフの明示的かつ高次元の表現を可能にする。
  • 大規模なグラフから任意の高次グラフレットを効率的にサンプリングするための確率的手順を開発する。
  • 同型のグラフレットをグループ化し、大規模なグラフコレクションにおけるその分布を捉えるために、低衝突のグラフハッシュ関数を設計する。
  • 高次グラフレットを用いて複雑な局所的特徴およびそれらの相互作用をモデル化することで、グラフ分類のパフォーマンスを向上させる。

提案手法

  • 与えられたグラフから高次グラフレット(サイズが増加する部分グラフ)を効率的にサンプリングするための確率的探索手順を提案する。
  • 衝突確率を最小限に抑えたグラフハッシュ関数を用い、同型のグラフレットを同定・グループ化し、分布的解析に用いる。
  • 複数の順序における同型のグラフレットの頻度分布に基づいて、グラフのベクトル表現を構築する。
  • 得られた高次グラフレット特徴量をサポートベクターマシン(SVM)と統合して分類に用いる。
  • 明示的なベクトル空間埋め込みを活用し、グラフ構造データに対して標準的な機械学習パイプラインを可能にする。
  • サンプリングプロセスの制御と効果的なハッシュ化による情報損失の最小化により、スケーラビリティと正確性を確保する。

実験結果

リサーチクエスチョン

  • RQ1高次グラフレットの確率的サンプリングは、より表現力がありスケーラブルなグラフ埋め込み手法を可能にするか?
  • RQ2低衝突のグラフハッシュ関数は、分布的表現のための同型グラフレットをどれほど効果的にグループ化できるか?
  • RQ3低次の手法や非埋め込み手法と比較して、高次グラフレット特徴量はグラフ分類パフォーマンスをどの程度向上させるか?
  • RQ4提案手法は、パターン認識分野の多様なグラフコレクションおよびベンチマークデータセットに一般化可能か?
  • RQ5高次グラフレットを用いて捉えた局所的グラフ構造間の複雑な相互作用は、分類性能の向上にどのように寄与するか?

主な発見

  • 提案された高次確率的グラフレット埋め込み(SGE)は、ベースライン手法と比較して、グラフ分類タスクで優れたパフォーマンスを達成する。
  • 確率的サンプリングの活用により、計算コストが著しく増大することなく高次グラフレットの抽出が可能になる。
  • 低衝突のグラフハッシュ関数は、同型のグラフレットを効果的にグループ化し、正確な分布モデリングに向けた構造的情報を保持する。
  • SVMと組み合わせることで、本手法はグラフベースのパターン比較および分類に肯定的な影響を及ぼす。
  • 標準ベンチマークデータベースにおける実験により、SGEの有効性と頑健性が、多様なグラフタイプにわたり確認された。
  • 高次グラフレットは複雑な局所的相互作用を捉え、低次の対応物と比較してより判別力のあるグラフ表現をもたらす。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。