Skip to main content
QUICK REVIEW

[論文レビュー] Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models

Linhao Luo, Zicheng Zhao|arXiv (Cornell University)|Oct 16, 2024
Advanced Graph Neural Networks被引用数 5
ひとこと要約

GCRはKG-TrieインデックスでLLMの推論を制約するKG-grounded decodingフレームワークを導入し、知識グラフ上で忠実でゼロ幻覚の推論と最先端のKGQA性能を実現します。

ABSTRACT

Large language models (LLMs) have demonstrated impressive reasoning abilities, but they still struggle with faithful reasoning due to knowledge gaps and hallucinations. To address these issues, knowledge graphs (KGs) have been utilized to enhance LLM reasoning through their structured knowledge. However, existing KG-enhanced methods, either retrieval-based or agent-based, encounter difficulties in accurately retrieving knowledge and efficiently traversing KGs at scale. In this work, we introduce graph-constrained reasoning (GCR), a novel framework that bridges structured knowledge in KGs with unstructured reasoning in LLMs. To eliminate hallucinations, GCR ensures faithful KG-grounded reasoning by integrating KG structure into the LLM decoding process through KG-Trie, a trie-based index that encodes KG reasoning paths. KG-Trie constrains the decoding process, allowing LLMs to directly reason on graphs and generate faithful reasoning paths grounded in KGs. Additionally, GCR leverages a lightweight KG-specialized LLM for graph-constrained reasoning alongside a powerful general LLM for inductive reasoning over multiple reasoning paths, resulting in accurate reasoning with zero reasoning hallucination. Extensive experiments on several KGQA benchmarks demonstrate that GCR achieves state-of-the-art performance and exhibits strong zero-shot generalizability to unseen KGs without additional training.

研究の動機と目的

  • 構造化された KG 知識と非構造化された LLM 推論を橋渡しして忠実な KG-aware の回答を得る
  • KG 構造で LLM のデコードを制約し幻覚を排除する
  • 軽量な KG-specialized LLM と強力な一般 LLM を活用して複数パスの効率的で帰納的な推論を行う
  • unseen KGs へのゼロショット一般化で最先端の KGQA 性能を達成する
  • 取得型・エージェントベースの KG 推論手法に比べて効率性を示す

提案手法

  • KG を KG-Trie に変換し推論パスの構造化インデックスとする
  • KG-specialized LLM によるグラフ制約デコードで KG-grounded 推論パスと仮説回答を KG-Trie 制約の下で生成する
  • グラフ制約デコードデータで軽量 KG-specialized LLM をファインチューニングする
  • 複数の KG-grounded パスを一般 LLM(FiD風)に入力して最終的な帰納推論と回答生成を行う
  • 追加トレーニングなしで unseen KGs に KG-Trie を適用してゼロショット一般化を行う

実験結果

リサーチクエスチョン

  • RQ1GCR は有利な効率性を備えた最先端の推論性能を達成できるか
  • RQ2GCR は幻覚を排除しKG-grounded 推論の忠実性を確保できるか
  • RQ3GCR は unseen KGs へゼロショット設定で一般化できるか
  • RQ4KG-specialized LLM と一般 LLM の寄与は何か
  • RQ5ビーム幅とパス長さは性能と効率にどのような影響を与えるか

主な発見

TypeMethodsWebQSP HitWebQSP F1CWQ HitCWQ F1
LLM ReasoningQwen2-0.5B26.211.012.511.0
LLM ReasoningQwen2-1.5B41.328.018.515.7
LLM ReasoningQwen2-7B50.835.525.321.6
LLM ReasoningLlama-2-7B56.436.528.421.4
LLM ReasoningLlama-3.1-8B55.534.828.122.4
LLM ReasoningGPT-4o-mini63.840.563.840.5
LLM ReasoningChatGPT59.343.534.730.2
LLM ReasoningChatGPT+Few-shot68.538.138.528.0
LLM ReasoningChatGPT+CoT73.538.547.531.0
LLM ReasoningChatGPT+Self-Consistency83.563.456.048.1
Graph ReasoningGraftNet66.762.436.832.7
Graph ReasoningNSM68.762.847.642.4
Graph ReasoningSR+NSM68.964.150.247.1
Graph ReasoningReaRev76.470.952.947.8
KG+LLMKD-CoT68.652.555.7-
KG+LLMEWEK-QA71.3-52.5-
KG+LLMToG (ChatGPT)76.2-57.6-
KG+LLMToG (GPT-4)82.6-68.5-
KG+LLMEffiQA82.9-69.5-
GCR(Llama-3.1-8B + ChatGPT)92.673.272.760.9
GCR(Llama-3.1-8B + GPT-4o-mini)92.274.175.861.7
  • GCR は WebQSP と CWQ で最先端の Hits を達成し、Hit と F1 の両方でベースラインを上回る。
  • KG 制約により両データセットで100% の忠実な推論を実現し、 Tested cases で幻覚を排除。
  • ゼロショット実験で unseen KGs へ転移した場合 CSQA および MedQA で ChatGPT および GPT-4o-mini を上回る。
  • 軽量な KG-specialized LLM(0.5B)はファインチューニング後により大規模モデルを超えることがあり、専門化の利点を強調。
  • ビーム幅とパス長(K と L)は探索と信頼性のバランスを取り、K=10, L=2 が強い性能と効率のトレードオフを提供。
  • GCR は KG-Trie 制約でデコードを行い効率を維持し、追加の LLM 呼び出しなしで並列探索を可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。