[논문 리뷰] TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs)
TRACE는 동결된 LLM을 다중 에이전트 시스템으로 변환하여 듀얼 메모리(Global Protocol 및 Individual Protocol)를 활용해 피팅 없이도 스트리밍 EHR에서 신뢰할 수 있는 유한 비용의 시계열 추론을 수행합니다.
Large Language Models (LLMs) encode extensive medical knowledge but struggle to apply it reliably to longitudinal patient trajectories, where evolving clinical states, irregular timing, and heterogeneous events degrade performance over time. Existing adaptation strategies rely on fine-tuning or retrieval-based augmentation, which introduce computational overhead, privacy constraints, or instability under long contexts. We introduce TRACE (Temporal Reasoning via Agentic Context Evolution), a framework that enables temporal clinical reasoning with frozen LLMs by explicitly structuring and maintaining context rather than extending context windows or updating parameters. TRACE operates over a dual-memory architecture consisting of a static Global Protocol encoding institutional clinical rules and a dynamic Individual Protocol tracking patient-specific state. Four agentic components, Router, Reasoner, Auditor, and Steward, coordinate over this structured memory to support temporal inference and state evolution. The framework maintains bounded inference cost via structured state compression and selectively audits safety-critical clinical decisions. Evaluated on longitudinal clinical event streams from MIMIC-IV, TRACE significantly improves next-event prediction accuracy, protocol adherence, and clinical safety over long-context and retrieval-augmented baselines, while producing interpretable and auditable reasoning traces.
연구 동기 및 목표
- 모델 매개변수를 업데이트하지 않고 비정상(non-stationary) EHR 스트림에서 견고하고 장기적 임상 추론을 촉진하려는 목표.
- 기관 지침과 환자 특성 상태를 구분하는 듀얼-메모리 구조를 제안합니다.
- 오프라인 Reflector를 개발하여 일반화 가능한 기관 규칙을 유도하고 배포를 위해 이를 고정합니다.
- Router, Reasoner, Auditor, Steward로 구성된 에이전트식 추론 루프를 설명하고 경계된 추론 비용을 유지합니다.
- MIMIC-IV 데이터에 대해 baselines 대비 예측 정확도, 프로토콜 준수 및 안전성을 개선한다는 것을 보여줍니다.
제안 방법
- Global Protocol(기관 레벨 규칙)과 Individual Protocol(환자 특이 상태)을 포함하는 듀얼 메모리 아키텍처를 도입합니다.
- 구조화된 메모리에 대해 트리거-가이드 추론을 수행하는 4-에이전트 루프(Router, Reasoner, Auditor, Steward)를 사용합니다.
- 온라인 추론 중에 고정되는 Global Protocol를 유도하고 확장하기 위한 오프라인 Reflector를 활용합니다.
- 상호 배치된 환자 상태를 압축하고 업데이트하는 Mitosis를 구현하여 궤적 길이에 무관하게 추론 비용을 제한된 구조로 유지합니다.
- 프리퀄 프로토콜과 함께 MIMIC-IV 종단 간 EHR 스트림에서 평가하고 장기 맥락, 검색 보강, 모놀리식 baselines와 비교합니다.
실험 결과
연구 질문
- RQ1고정된 LLM이 구조화된 메모리 아키텍처를 통해 장기적이고 시간에 따라 변화하는 임상 추론으로 효과적으로 유도될 수 있는가?
- RQ2기관 규칙과 환자 특성 상태를 구분하는 것이 긴 의학적 궤적에서 정확도, 안전성, 효율성을 향상시키는가?
- RQ3오프라인 규칙 유도(Reflector)가 배포 성능 및 일반화에 어떤 영향을 미치는가?
- RQ4조건부 감사가 온라인 추론에서 안전성, 근거 제시, 계산 비용에 어떤 영향을 미치는가?
주요 결과
- TRACE는 여러 백본에서 약물 및 검사 주문의 Recall@5를 크게 향상시킵니다.
- 프로토콜 준수는 여전히 높게 유지됩니다(92.1%–94.7%).
- Auditor 활성화는 조건부이며 일반적으로 낮아(5.15%–9.42%) 추가 계산을 제한합니다.
- Global Protocol 및 Mitosis가 성능과 안정성에 결정적임을 시사하는 제거 실험이 있습니다.
- 임상 등가성 점수는 TRACE가 baselines 대비 향상됩니다(2.95–3.28에서 3.56–3.96으로).
- 최고 성능 구성은 매개변수 업데이트 없이도 강력한 준수와 합리적 등가성을 달성합니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.