Skip to main content
QUICK REVIEW

[論文レビュー] Both Topology and Text Matter: Revisiting LLM-guided Out-of-Distribution Detection on Text-attributed Graphs

Zhu, Yinlin, Di Wu|arXiv (Cornell University)|Feb 12, 2026
Advanced Graph Neural Networks被引用数 0
ひとこと要約

LG-Plug は、テキスト属性グラフにおけるトポロジーとテキストを整合させ、合意ベースの LLM 由来の OOD エクスポージャを正則化として用いるプラグアンドプレイ型フレームワークであり、六つの TAG ベンチマークにおけるトポロジー主導の OOD 検出器を LLM ベースのベースラインと比較して最先端の性能を達成します。

ABSTRACT

Text-attributed graphs (TAGs) associate nodes with textual attributes and graph structure, enabling GNNs to jointly model semantic and structural information. While effective on in-distribution (ID) data, GNNs often encounter out-of-distribution (OOD) nodes with unseen textual or structural patterns in real-world settings, leading to overconfident and erroneous predictions in the absence of reliable OOD detection. Early approaches address this issue from a topology-driven perspective, leveraging neighboring structures to mitigate node-level detection bias. However, these methods typically encode node texts as shallow vector features, failing to fully exploit rich semantic information. In contrast, recent LLM-based approaches generate pseudo OOD priors by leveraging textual knowledge, but they suffer from several limitations: (1) a reliability-informativeness imbalance in the synthesized OOD priors, as the generated OOD exposures either deviate from the true OOD semantics, or introduce non-negligible ID noise, all of which offers limited improvement to detection performance; (2) reliance on specialized architectures, which prevents incorporation of the extensive effective topology-level insights that have been empirically validated in prior work. To this end, we propose LG-Plug, an LLM-Guided Plug-and-play strategy for TAG OOD detection tasks. LG-Plug aligns topology and text representations to produce fine-grained node embeddings, then generates consensus-driven OOD exposure via clustered iterative LLM prompting. Moreover, it leverages lightweight in-cluster codebook and heuristic sampling reduce time cost of LLM querying. The resulting OOD exposure serves as a regularization term to separate ID and OOD nodes, enabling seamless integration with existing detectors.

研究の動機と目的

  • TAG における既存の LLM ベース OOD priors の信頼性-情報量の不均衡とトポロジー主導検出器との適合性の欠如という制約を特定する。
  • LG-Plug を提案し、トポロジー-テキスト表現の整合と合意ベースの LLM 由来 OOD エクスポージャを生成する。
  • LLM 由来の priors をトポロジー主導のグラフ OOD 検出器の正則化項としてシームレスに統合できるようにする。
  • 六つの TAG ベンチマークで有効性と効率を示す。

提案手法

  • 2 層 GCN をグラフエンコーダ、Transformer ベースのテキストエンコーダを用いてノード埋め込みを整列させるトポロジー-テキスト表現整合モジュールを訓練する。
  • ノードレベルおよびエッジレベルの対比学習 Objective を用いてグラフとテキストの表現を共同最適化する。
  • ラベルなしノード埋め込みをクラスタリングし、ほぼ中心近傍の代表サンプルに対して合意ベースの LLM プロンプトを実行して信頼性のある OOD エクスポージャを生成する。
  • 軽量なクラスタ内カテゴリー辞書を維持し、バッチ単位で反復的に LLM プロンプトを実行してクエリを最小化する。
  • クラスタごとに辞書から上位 K 個の OOD カテゴリを選択し、それらを ID カテゴリを除外する信頼性の高い OOD エクスポージャとして扱う。
  • このエクスポージャをスコアレベルの正則化項として組み込み、検出器のアーキテクチャを変更せずに ID と OOD の分離を促進する。
Figure 1 . Illustration of the reliability-informativeness imbalance in LLM-based OOD prior generation: (a) Realistic ID and OOD categories on Cora (Yang et al. , 2016 ) . (b) Reliability-oriented methods avoid ID overlap but yield semantically unrealistic priors, limiting informativeness. (c) Infor
Figure 1 . Illustration of the reliability-informativeness imbalance in LLM-based OOD prior generation: (a) Realistic ID and OOD categories on Cora (Yang et al. , 2016 ) . (b) Reliability-oriented methods avoid ID overlap but yield semantically unrealistic priors, limiting informativeness. (c) Infor

実験結果

リサーチクエスチョン

  • RQ1Q1: LLM は TAG OOD 検出のために信頼性が高く有益な疑似 OOD priors をどのように生成できるか。
  • RQ2Q2: LLM 由来の OOD priors を、既存のトポロジー主導のグラフ OOD 検出器との適合性を犠牲にせずに利用するにはどうするか。

主な発見

  • LG-Plug は六つの TAG ベンチマークでトポロジー主導の OOD 手法を一貫して改善し(FPR95 の削減 ≥7%)、
  • LG-Plug は LLM ベースのグラフ OOD ベースラインと比較して最先端の削減を達成(FPR95 の削減 ≥5%)。
  • トポロジー-テキスト整合と合意ベースの OOD エクスポージャは、従来の LLM 単独アプローチよりも信頼性が高く有益な OOD priors をもたらす。
  • OOD エクスポージャは軽量なスコア正則化として機能し、GNNSafe や GRASP などの検出器とのシームレスな統合を可能にする。
  • 可視化から、LG-Plug は ID と OOD のスコア分布の重複を減らしつつ、トポロジー主導の検出器の形状を保持することが示される。
Figure 2 . Overview of the proposed LG-Plug plug-and-play framework. (a) Topology-Text Representation Alignment jointly trains a graph encoder and a text encoder to learn fine-grained and discriminative node embeddings for both ID and OOD nodes. (b) Consensus-driven OOD Exposure with LLM identifies
Figure 2 . Overview of the proposed LG-Plug plug-and-play framework. (a) Topology-Text Representation Alignment jointly trains a graph encoder and a text encoder to learn fine-grained and discriminative node embeddings for both ID and OOD nodes. (b) Consensus-driven OOD Exposure with LLM identifies

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。