[论文解读] SOPRAG: Multi-view Graph Experts Retrieval for Industrial Standard Operating Procedures
SOPRAG 引入一个带有三种专门图专家(实体、因果、流程)、一个 Procedure Card 門控层,以及一个由 LLM 指导的路由器的 Mixture-of-Experts 检索框架,以检索并生成可执行的 SOP,并且为工业 SOP 提供一个自动化基准测试。
Standard Operating Procedures (SOPs) are essential for ensuring operational safety and consistency in industrial environments. However, retrieving and following these procedures presents unique challenges, such as rigid proprietary structures, condition-dependent relevance, and actionable execution requirement, which standard semantic-driven Retrieval-Augmented Generation (RAG) paradigms fail to address. Inspired by the Mixture-of-Experts (MoE) paradigm, we propose SOPRAG, a novel framework specifically designed to address the above pain points in SOP retrieval. SOPRAG replaces flat chunking with specialized Entity, Causal, and Flow graph experts to resolve industrial structural and logical complexities. To optimize and coordinate these experts, we propose a Procedure Card layer that prunes the search space to eliminate computational noise, and an LLM-Guided gating mechanism that dynamically weights these experts to align retrieval with operator intent. To address the scarcity of domain-specific data, we also introduce an automated, multi-agent workflow for benchmark construction. Extensive experiments across four industrial domains demonstrate that SOPRAG significantly outperforms strong lexical, dense, and graph-based RAG baselines in both retrieval accuracy and response utility, achieving perfect execution scores in real-world critical tasks.
研究动机与目标
- 识别工业 SOP 检索中的挑战:专有结构、条件相关性及可执行输出需求。
- 提出一个结构感知的 MoE 框架(实体、因果、流程图)并配备一个 Procedure Card 层以缩小检索空间。
- 开发一个意图感知的 LLM 路由器以对查询意图进行门控与对专家的权重分配。
- 创建一个用于领域特定 SOP 数据集的自动化多智能体基准构建流水线。
提出的方法
- 将每个 SOP 表示为一个稀疏激活的 Procedure Card 和三个专门图专家(实体、因果、流程)。
- 构建一个实体图,将实体链接到其支配的 Procedure Card,以解决专有结构问题。
- 构建一个因果图,建模从症状/原因到相关 Procedure Card 的状态转移。
- 为每个 Procedure Card 开发一个 Flow Graph,以捕捉流程步骤并实现可执行提示。
- 采用粗到细的检索:先选取 Top-K 的 Procedure Cards,然后通过一个由 LLM 指导的路由器对 E、C、F 三个专家进行加权并计算最终相关性分数。
- 通过将检索到的 Flow Graph 线性化为经验证的逐步提示,生成结构感知的回答。
实验结果
研究问题
- RQ1如何在尊重专有设备上下文与参数约束的前提下改进 SOP 检索?
- RQ2相比于扁平截块或通用图,基于多视图图结构的方法是否能更好地捕捉 SOP 的因果和序列依赖?
- RQ3面向意图的路由机制是否能提高工业 SOP 的检索准确性和生成功能的保真性?
主要发现
- SOPRAG 在四个领域的检索指标(MRR 和 Acc@K)上持续优于词汇、密集向量和 GraphRAG 等基线。
- SOPRAG 在 Airline Services 中达到峰值 MRR 0.76 和 Acc@5 0.93,展现出强大的领域适应性。
- 生成质量(可信度、相关性、上下文精度)在 SOPRAG 中最高,在 Data Center 任务中达到完美的 SOP 质量分数 1.0。
- 消融实验显示 Procedure Card 层和每个图专家均有显著贡献,基于路由的门控在静态平均之外带来额外收益。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。