[论文解读] TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs)
TRACE 将冻结的 LLM 转换为具有双记忆(全局协议和个人协议)的多代理系统,以在流式 EHR 上进行可靠、受限成本的时序推理,且无需微调或无限上下文窗口。
Large Language Models (LLMs) encode extensive medical knowledge but struggle to apply it reliably to longitudinal patient trajectories, where evolving clinical states, irregular timing, and heterogeneous events degrade performance over time. Existing adaptation strategies rely on fine-tuning or retrieval-based augmentation, which introduce computational overhead, privacy constraints, or instability under long contexts. We introduce TRACE (Temporal Reasoning via Agentic Context Evolution), a framework that enables temporal clinical reasoning with frozen LLMs by explicitly structuring and maintaining context rather than extending context windows or updating parameters. TRACE operates over a dual-memory architecture consisting of a static Global Protocol encoding institutional clinical rules and a dynamic Individual Protocol tracking patient-specific state. Four agentic components, Router, Reasoner, Auditor, and Steward, coordinate over this structured memory to support temporal inference and state evolution. The framework maintains bounded inference cost via structured state compression and selectively audits safety-critical clinical decisions. Evaluated on longitudinal clinical event streams from MIMIC-IV, TRACE significantly improves next-event prediction accuracy, protocol adherence, and clinical safety over long-context and retrieval-augmented baselines, while producing interpretable and auditable reasoning traces.
研究动机与目标
- 在非平稳的 EHR 流上推动稳健、长时域的临床推理,而不更新模型参数。
- 提出一种将机构指南与患者特定状态分离的双记忆架构。
- 开发离线 Reflector 以诱导通用的机构规则并在部署时冻结。
- 描述一个具代理推理环(Router、Reasoner、Auditor、Steward),以维持有界的推理成本。
- 在 MIMIC-IV 数据上相对于基线展示更高的预测准确性、协议遵循性与安全性。
提出的方法
- 引入一个双记忆架构,包含全球协议(机构级规则)与个人协议(患者特定状态)。
- 使用四子代理循环(Router、Reasoner、Auditor、Steward)对结构化记忆进行触发引导的推理。
- 采用离线 Reflector 来诱导并扩展全球协议,在在线推理期间被冻结。
- 实现 Mitosis 以压缩并更新有界、结构化的患者状态,使推理成本与轨迹长度无关。
- 在 MIMIC-IV 纵向 EHR 流上,用前瞻性协议进行评估,并与长期上下文、检索增强与单体基线进行比较。
实验结果
研究问题
- RQ1一个冻结的 LLM 能否通过结构化记忆架构有效地引导实现长时域、随时间演变的临床推理?
- RQ2将机构规则与患者特定状态分离是否能在长期医疗轨迹中提升准确性、安全性与效率?
- RQ3离线规则诱导(Reflector)对部署性能与泛化有何影响?
- RQ4有条件的审计如何影响在线推理中的安全性、基础性与计算成本?
主要发现
- TRACE 在多种基础模型上显著提升了药物与实验室项目 Recall@5。
- 协议遵循性保持在较高水平(92.1%–94.7%)。
- Auditor 的激活是条件性的且通常较低(5.15%–9.42%),从而限制额外计算。
- 消融实验表明 Global Protocol 与 Mitosis 对性能与稳定性至关重要。
- 相较基线,临床等效性分数在 TRACE 下提升(2.95–3.28 提升至 3.56–3.96)。
- 最佳配置在不更新参数的情况下实现强遵循性与合理的等效性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。