[论文解读] Think-on-Graph: Deep and Responsible Reasoning of Large Language Model on Knowledge Graph
提出 Think-on-Graph(ToG),一种紧耦合的 LLM⊗KG 推理框架,在该框架中,LLM 充当代理,通过束搜索迭代地探索知识图谱,从而在无需额外训练的情况下提升深度推理、可追溯性和灵活性。
Although large language models (LLMs) have achieved significant success in various tasks, they often struggle with hallucination problems, especially in scenarios requiring deep and responsible reasoning. These issues could be partially addressed by introducing external knowledge graphs (KG) in LLM reasoning. In this paper, we propose a new LLM-KG integrating paradigm ``$\hbox{LLM}\otimes\hbox{KG}$'' which treats the LLM as an agent to interactively explore related entities and relations on KGs and perform reasoning based on the retrieved knowledge. We further implement this paradigm by introducing a new approach called Think-on-Graph (ToG), in which the LLM agent iteratively executes beam search on KG, discovers the most promising reasoning paths, and returns the most likely reasoning results. We use a number of well-designed experiments to examine and illustrate the following advantages of ToG: 1) compared with LLMs, ToG has better deep reasoning power; 2) ToG has the ability of knowledge traceability and knowledge correctability by leveraging LLMs reasoning and expert feedback; 3) ToG provides a flexible plug-and-play framework for different LLMs, KGs and prompting strategies without any additional training cost; 4) the performance of ToG with small LLM models could exceed large LLM such as GPT-4 in certain scenarios and this reduces the cost of LLM deployment and application. As a training-free method with lower computational cost and better generality, ToG achieves overall SOTA in 6 out of 9 datasets where most previous SOTAs rely on additional training.
研究动机与目标
- 推动整合外部知识图谱,以解决大型语言模型的幻觉和有限的深度推理问题。
- 提出一种紧耦合的 LLM⊗KG 范式用于交互式 KG 推理。
- 开发 ToG,通过束搜索迭代性地探索 KG 路径,并给出解释和可追溯的推理路径。
- 在多个数据集和主干模型上展示 ToG 的有效性,包括较小的 LLM。
提出的方法
- 引入 LLM⊗KG 范式,在该范式中,LLM 充当代理以探索 KG 三元组并对检索到的知识进行推理。
- 实现 Think-on-Graph (ToG),包含三个阶段:初始化、探索(通过束搜索对关系和实体进行裁剪)和推理。
- 使用束搜索来维护前 N 条推理路径,并逐深度扩展它们,直到产生一个有把握的答案。
- 提供基于关系的变体(ToG-R),专注于关系链并使用随机裁剪以降低计算量。
- 展示训练无关的运行方式,并与多种 LLM 和知识图谱实现即插即用的兼容性,而无需更新 LLM 参数。
实验结果
研究问题
- RQ1与基于提示的基线相比,ToG 是否能够在基于 KG 的问题上提升深层多步推理?
- RQ2ToG 是否提供知识可追溯性和纠错机制以减少幻觉?
- RQ3ToG 在不同主干 LLM 和知识图谱上的表现如何?
- RQ4在保持或提升性能的同时,ToG 是否比以大型 LLM 为中心的方法更具成本效益?
- RQ5提示设计、KG 类型和裁剪策略对 ToG 性能的影响有哪些?
主要发现
- 使用 GPT-4 的 ToG 在 9 个数据集中的 7 个上达到新的 SOTA,在所有评估的数据集上都优于基线提示方法。
- ToG 通过从 KG 中提取多样化的推理路径,实现深度、多跳推理。
- ToG 通过显式的推理路径和溯源追踪提供知识可追溯性和可纠错性。
- ToG 的即插即用设计在 LLM(ChatGPT、GPT-4、LLaMA-2)和 KG(Freebase、Wikidata)上均能工作,收益各异。
- 较小的 LLM(例如 LLaMA-2-70B)结合 ToG 在 KGQA 场景中可能优于某些更大规模的 LLM,带来成本收益。
- 使用训练无关提示的 ToG 在性能上与基于训练的 SOTA 相当,同时降低了训练需求。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。