Skip to main content
QUICK REVIEW

[論文レビュー] A Simple Baseline Algorithm for Graph Classification

Nathan de Lara, Edouard Pineau|ArXiv.org|Oct 22, 2018
Graph Theory and Algorithms参考文献 13被引用数 43
ひとこと要約

本論文は、正規化ラプラシアンの最小正の固有値をスペクトル特徴として用い、ランダムフォレスト分類器と組み合わせた、グラフ分類の単純で高速なベースラインを提案し、過度なハイパーパラメータ調整なしで標準データセット上で競合的な結果を達成する。

ABSTRACT

Graph classification has recently received a lot of attention from various fields of machine learning e.g. kernel methods, sequential modeling or graph embedding. All these approaches offer promising results with different respective strengths and weaknesses. However, most of them rely on complex mathematics and require heavy computational power to achieve their best performance. We propose a simple and fast algorithm based on the spectral decomposition of graph Laplacian to perform graph classification and get a first reference score for a dataset. We show that this method obtains competitive results compared to state-of-the-art algorithms.

研究の動機と目的

  • ノード特徴量なしでグラフ構造のみに基づく軽量なグラフ分類ベースラインを動機づける。
  • 正規化ラプラシアンのスペクトル特性が分類用の有効なグラフ埋め込みになり得るかを探る。
  • 提案ベースラインの性能と計算時間を、最先端のグラフ分類手法と比較して評価する。

提案手法

  • 各グラフの正規化ラプラシアンを構築し、スペクトル特徴として k 個の最小の正の固有値を計算する(必要に応じて0でパディング)。
  • ノードラベル付けに対して順序不変なスペクトル(SF)としてグラフを表現する。
  • スペクトル特徴に標準分類器(クラス重みをバランスさせたランダムフォレスト)を用いてベースラインモデルとする。
  • 埋め込み次元 k および RFC のハイパーパラメータに対する頑健性を、データセットを跨ぐ実験で評価する。
  • 他のグラフ分類手法(EMD、PM、FB、DyF、SGE)と、MT、PTC、EZ、PF、DD、NCI1 のデータセットを用いて比較する。

実験結果

リサーチクエスチョン

  • RQ1ノード特徴量なしでも、単純な置換不変スペクトル表現が競争力のあるグラフ分類に十分か?
  • RQ2スペクトル特徴の次元数と分類器の選択が、標準データセット全体での精度と頑健性にどう影響するか?
  • RQ3提案 SF + RFC ベースラインは、精度と計算時間の点で最先端のグラフ分類手法と比べてどうか?

主な発見

MTPTCEZPFDDNCI1
86.157.736.8--72.7
85.659.428.2-75.669.7
84.755.629.070.0-62.9
86.356.226.673.1-66.6
87.260.040.7-76.6-
88.462.843.773.675.475.2
  • SF + RFC は、MT, PTC, EZ, PF, NCI1 の6データセット中5データセットでトップ性能を達成。
  • RFC を用いたベースライン埋め込みは極めて高速で、報告セットアップの総実験時間は5分未満。
  • 異なる埋め込み次元は、小さな k(例: k=5)でも競争力のある結果を生み、大きい k でわずかな改善にとどまる。
  • 手法はデータセットごとの重いハイパーパラメータ調整を必要とせず、RFC のハイパーパラメータにも頑健である。
  • 他の手法(EMD、PM、FB、DyF、SGE)と比較して、SF + RFC は複数データセットで競争力のある精度を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。