QUICK REVIEW

[論文レビュー] TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs)

Zhan Qu, Michael Färber|arXiv (Cornell University)|Feb 13, 2026

Machine Learning in Healthcare被引用数 0

ひとこと要約

TRACE は凍結済み LLM を多エージェント系に変換し、グローバル・プロトコルと個別プロトコルという二重記憶を用いて、微調整や無限の文脈窓なしに、ストリーミングされる EHR に対する信頼性が高く、境界付きコストの時間的推論を実行します。

ABSTRACT

Large Language Models (LLMs) encode extensive medical knowledge but struggle to apply it reliably to longitudinal patient trajectories, where evolving clinical states, irregular timing, and heterogeneous events degrade performance over time. Existing adaptation strategies rely on fine-tuning or retrieval-based augmentation, which introduce computational overhead, privacy constraints, or instability under long contexts. We introduce TRACE (Temporal Reasoning via Agentic Context Evolution), a framework that enables temporal clinical reasoning with frozen LLMs by explicitly structuring and maintaining context rather than extending context windows or updating parameters. TRACE operates over a dual-memory architecture consisting of a static Global Protocol encoding institutional clinical rules and a dynamic Individual Protocol tracking patient-specific state. Four agentic components, Router, Reasoner, Auditor, and Steward, coordinate over this structured memory to support temporal inference and state evolution. The framework maintains bounded inference cost via structured state compression and selectively audits safety-critical clinical decisions. Evaluated on longitudinal clinical event streams from MIMIC-IV, TRACE significantly improves next-event prediction accuracy, protocol adherence, and clinical safety over long-context and retrieval-augmented baselines, while producing interpretable and auditable reasoning traces.

研究の動機と目的

非定常な EHR ストリーム上でモデルパラメータを更新せずに、堅牢な長期前方の臨床推論を促進する。
機関連則と患者固有の状態を分離する二重記憶アーキテクチャを提案する。
一般化可能な機関ルールを誘導し凍結してデプロイするオフライン・リフレクターを開発する。
境界付き推論コストを維持するエージェンティック推論ループ（ルータ、リソーナ、オーディター、スチュワード）を記述する。
基準系と比較して MIMIC-IV データ上で予測精度、プロトコル遵守、安全性が改善されることを示す。

提案手法

機関レベルのルールを含む Global Protocol と、患者固有の状態を含む Individual Protocol の二重記憶アーキテクチャを導入する。
構造化された記憶上のトリガー指向推論を行う四エージェンのループ（Router, Reasoner, Auditor, Steward）を用いる。
オフライン・リフレクターを用いて Global Protocol を誘導・拡張し、オンライン推論時にはそれを凍結する。
推論コストを軌道長さに依存させずに圧縮・更新する境界付き患者状態を保持する Mitosis を実装する。
事前順序的プロトコルを用いた MIMIC-IV の縦断的 EHR ストリーム上で、長文脈・検索付き・モノリシックなベースラインと比較して評価する。

実験結果

リサーチクエスチョン

RQ1凍結済み LLM を、構造化された記憶アーキテクチャを介して長期・時間発展的な臨床推論に効果的に誘導できるか？
RQ2機関連則と患者固有状態を分離することで、長い医療経路にわたり精度・安全性・効率が改善されるか？
RQ3オフラインのルール誘導（リフレクター）がデプロイ時の性能と一般化に与える影響は？
RQ4条件付きオーディットはオンライン推論における安全性、根拠付け、計算コストへどう寄与するか？

主な発見

Method	Medication Recall@5	Lab Order Recall@5	Procedure Recall@5	Clinical Equivalence	Protocol Adherence	Auditor Activation Rate
Long-Context (Llama-3-70B)	0.3192	0.2119	0.3511	2.95	-	-
Static RAG (Contriever)	0.3221	0.1245	0.2827	3.10	-	-
Monolithic Agent (MemGPT)	0.3224	0.136	0.3313	3.28	-	-
TRACE (Llama-3.1-70B)	0.5986	0.4176	0.4184	3.56	92.8%	9.42%
TRACE (Qwen-2.5-72B-Instruct)	0.5327	0.4332	0.3817	3.71	93.6%	7.13%
TRACE (Mixtral-8x22B-v0.1)	0.5530	0.5727	0.3718	3.85	92.1%	5.15%
TRACE (DeepSeek-V3.1)	0.3348	0.4323	0.3089	3.96	94.7%	6.23%
TRACE (Meditron-70B)	0.5723	0.4872	0.4219	3.91	94.0%	5.27%

TRACE は複数のバックボーンに対して薬剤・検査オーダーの Recall@5 を大幅に改善する。
プロトコル遵守は高水準を維持（92.1%–94.7%）。
Auditor の活性化は条件付きで、一般に低く（5.15%–9.42%）、追加計算を抑制する。
Global Protocol と Mitosis の寄与は性能と安定性にとって重要であることがアブレーションで示された。
Clinical Equivalence スコアは TRACE によりベースラインと比較して改善（2.95–3.28 が 3.56–3.96 へ）。
最も優れた構成はパラメータ更新なしで高い遵守と妥当性を達成。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。