[論文レビュー] Both Topology and Text Matter: Revisiting LLM-guided Out-of-Distribution Detection on Text-attributed Graphs
LG-Plug は、テキスト属性グラフにおけるトポロジーとテキストを整合させ、合意ベースの LLM 由来の OOD エクスポージャを正則化として用いるプラグアンドプレイ型フレームワークであり、六つの TAG ベンチマークにおけるトポロジー主導の OOD 検出器を LLM ベースのベースラインと比較して最先端の性能を達成します。
Text-attributed graphs (TAGs) associate nodes with textual attributes and graph structure, enabling GNNs to jointly model semantic and structural information. While effective on in-distribution (ID) data, GNNs often encounter out-of-distribution (OOD) nodes with unseen textual or structural patterns in real-world settings, leading to overconfident and erroneous predictions in the absence of reliable OOD detection. Early approaches address this issue from a topology-driven perspective, leveraging neighboring structures to mitigate node-level detection bias. However, these methods typically encode node texts as shallow vector features, failing to fully exploit rich semantic information. In contrast, recent LLM-based approaches generate pseudo OOD priors by leveraging textual knowledge, but they suffer from several limitations: (1) a reliability-informativeness imbalance in the synthesized OOD priors, as the generated OOD exposures either deviate from the true OOD semantics, or introduce non-negligible ID noise, all of which offers limited improvement to detection performance; (2) reliance on specialized architectures, which prevents incorporation of the extensive effective topology-level insights that have been empirically validated in prior work. To this end, we propose LG-Plug, an LLM-Guided Plug-and-play strategy for TAG OOD detection tasks. LG-Plug aligns topology and text representations to produce fine-grained node embeddings, then generates consensus-driven OOD exposure via clustered iterative LLM prompting. Moreover, it leverages lightweight in-cluster codebook and heuristic sampling reduce time cost of LLM querying. The resulting OOD exposure serves as a regularization term to separate ID and OOD nodes, enabling seamless integration with existing detectors.
研究の動機と目的
- TAG における既存の LLM ベース OOD priors の信頼性-情報量の不均衡とトポロジー主導検出器との適合性の欠如という制約を特定する。
- LG-Plug を提案し、トポロジー-テキスト表現の整合と合意ベースの LLM 由来 OOD エクスポージャを生成する。
- LLM 由来の priors をトポロジー主導のグラフ OOD 検出器の正則化項としてシームレスに統合できるようにする。
- 六つの TAG ベンチマークで有効性と効率を示す。
提案手法
- 2 層 GCN をグラフエンコーダ、Transformer ベースのテキストエンコーダを用いてノード埋め込みを整列させるトポロジー-テキスト表現整合モジュールを訓練する。
- ノードレベルおよびエッジレベルの対比学習 Objective を用いてグラフとテキストの表現を共同最適化する。
- ラベルなしノード埋め込みをクラスタリングし、ほぼ中心近傍の代表サンプルに対して合意ベースの LLM プロンプトを実行して信頼性のある OOD エクスポージャを生成する。
- 軽量なクラスタ内カテゴリー辞書を維持し、バッチ単位で反復的に LLM プロンプトを実行してクエリを最小化する。
- クラスタごとに辞書から上位 K 個の OOD カテゴリを選択し、それらを ID カテゴリを除外する信頼性の高い OOD エクスポージャとして扱う。
- このエクスポージャをスコアレベルの正則化項として組み込み、検出器のアーキテクチャを変更せずに ID と OOD の分離を促進する。

実験結果
リサーチクエスチョン
- RQ1Q1: LLM は TAG OOD 検出のために信頼性が高く有益な疑似 OOD priors をどのように生成できるか。
- RQ2Q2: LLM 由来の OOD priors を、既存のトポロジー主導のグラフ OOD 検出器との適合性を犠牲にせずに利用するにはどうするか。
主な発見
- LG-Plug は六つの TAG ベンチマークでトポロジー主導の OOD 手法を一貫して改善し(FPR95 の削減 ≥7%)、
- LG-Plug は LLM ベースのグラフ OOD ベースラインと比較して最先端の削減を達成(FPR95 の削減 ≥5%)。
- トポロジー-テキスト整合と合意ベースの OOD エクスポージャは、従来の LLM 単独アプローチよりも信頼性が高く有益な OOD priors をもたらす。
- OOD エクスポージャは軽量なスコア正則化として機能し、GNNSafe や GRASP などの検出器とのシームレスな統合を可能にする。
- 可視化から、LG-Plug は ID と OOD のスコア分布の重複を減らしつつ、トポロジー主導の検出器の形状を保持することが示される。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。