Skip to main content
QUICK REVIEW

[論文レビュー] STG-Mamba: Spatial-Temporal Graph Learning via Selective State Space Model

Lincan Li, Hanchen Wang|arXiv (Cornell University)|Mar 19, 2024
Advanced Graph Neural Networks被引用数 10
ひとこと要約

STG-Mamba は空間-時間グラフ学習に選択的状態空間モデルを導入し、GS3BとKFGNを用いて線形の複雑度と最先端の精度を持つSeq2Seq予測を実現する。

ABSTRACT

Spatial-Temporal Graph (STG) data is characterized as dynamic, heterogenous, and non-stationary, leading to the continuous challenge of spatial-temporal graph learning. In the past few years, various GNN-based methods have been proposed to solely focus on mimicking the relationships among node individuals of the STG network, ignoring the significance of modeling the intrinsic features that exist in STG system over time. In contrast, modern Selective State Space Models (SSSMs) present a new approach which treat STG Network as a system, and meticulously explore the STG system's dynamic state evolution across temporal dimension. In this work, we introduce Spatial-Temporal Graph Mamba (STG-Mamba) as the first exploration of leveraging the powerful selective state space models for STG learning by treating STG Network as a system, and employing the Spatial-Temporal Selective State Space Module (ST-S3M) to precisely focus on the selected STG latent features. Furthermore, to strengthen GNN's ability of modeling STG data under the setting of selective state space models, we propose Kalman Filtering Graph Neural Networks (KFGN) for dynamically integrate and upgrade the STG embeddings from different temporal granularities through a learnable Kalman Filtering statistical theory-based approach. Extensive empirical studies are conducted on three benchmark STG forecasting datasets, demonstrating the performance superiority and computational efficiency of STG-Mamba. It not only surpasses existing state-of-the-art methods in terms of STG forecasting performance, but also effectively alleviate the computational bottleneck of large-scale graph networks in reducing the computational cost of FLOPs and test inference time. The implementation code is available at: \url{https://github.com/LincanLi98/STG-Mamba}.

研究の動機と目的

  • 動的で異種な空間-時間グラフへ STG 予測を動機づける。
  • STG ダイナミクスをモデル化するためのグラフ選択的状態空間アーキテクチャを提案する。
  • 進化する STG 構造を扱う適応的グラフ学習を開発する。
  • Transformer ベースの STG モデルに対するスケーラビリティと効率性の利点を示す。

提案手法

  • STG 学習を積み重ねられた Graph Selective State Space Blocks (GS3B) を備えたエンコーダ-デコーダとして定式化する。
  • 適応的で時変するグラフ隣接行列を生成するために Kalman Filtering Graph Neural Networks (KFGN) を統合する。
  • 入力依存の特徴学習のため Graph State Space Layer (GSS-Layer) を採用する。
  • 効率的なディープラーニング実装を可能にするために連続状態空間ダイナミクスをゼロ次ホールドで離散化する。
  • シーケンス長 O(L) における線形時間計算量と Transformer ベースラインと比較した FLOPs の削減を示す。)

実験結果

リサーチクエスチョン

  • RQ1選択的状態空間モデルは動的 STG の依存関係を効果的に捉えられるか?
  • RQ2STG データに対して適応的グラフ学習を SSSM とどのように統合できるか?
  • RQ3GS3B/KFGN ベースの STG-Mamba は Transformer ベースの STG モデルと比較して、計算コストを抑えつつ予測精度が優れるか?

主な発見

モデルPeMS04 (Flow) RMSEPeMS04 (Flow) MAEPeMS04 (Flow) MAPEHZMetro RMSEHZMetro MAEHZMetro MAPEKnowAir RMSEKnowAir MAEKnowAir MAPE
STGCN35.5522.7014.5934.8521.3313.4720.6415.2712.92
STSGCN33.6521.1913.9033.2420.7913.0620.2515.2212.69
STG-NCDE31.0919.2112.7632.9120.7512.8820.0814.9311.87
DDGCRN30.5118.4512.1931.6919.5212.4519.6312.4511.84
ASTGCN35.2222.9316.5634.3621.1213.5020.3715.0712.11
ASTGNN31.1619.2612.6532.7520.6312.4719.9612.3811.23
PDFormer29.9718.3212.1030.1819.1311.9218.6512.2111.06
STAEformer30.1818.2211.9829.9418.8512.0318.4911.9310.75
MultiSPANS30.4619.0713.2930.3118.9711.8518.5712.2410.88
STG-Mamba29.5318.0912.1229.2618.3811.6718.0511.7310.66
  • STG-Mamba は PeMS04、HZMetro、KnowAir の各データセットで RMSE、MAE、MAPE の全指標でベースラインを一貫して上回り、1つの指標を除いてわずかな例外あり。
  • STG-Mamba は STG サイズに対して線形に FLOP が増加する顕著な計算効率を達成し、比較対象の Transformer より推論時間が短い。
  • データセットを問わず、多くのタスクで最良の RMSE と MAE を達成(例: PeMS04: RMSE 29.53、MAE 18.09; KnowAir: RMSE 18.05、MAE 11.73)。
  • 外部条件(混雑時間帯と非混雑時間帯、週末と平日)を変えても頑健な性能を示す。
  • 大規模な STG スケールでは STAEformer に比べて FLOPs を大幅に削減(例: 300 ノードの PeMS04: 36.85G 対 92.49G)。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。