[論文レビュー] LLM Augmented Intervenable Multimodal Adaptor for Post-operative Complication Prediction in Lung Cancer Surgery
MIRACLEは術前臨床データ、CT放射線学特徴、LLM生成の説明を統合した統一の介入可能な多模態モデルを提供し、肺がん手術後の合併症を予測します。ベースラインを上回り、臨床医の介入を可能にします。
Postoperative complications remain a critical concern in clinical practice, adversely affecting patient outcomes and contributing to rising healthcare costs. We present MIRACLE, a deep learning architecture for prediction of risk of postoperative complications in lung cancer surgery by integrating preoperative clinical and radiological data. MIRACLE employs a hyperspherical embedding space fusion of heterogeneous inputs, enabling the extraction of robust, discriminative features from both structured clinical records and high-dimensional radiological images. To enhance transparency of prediction and clinical utility, we incorporate an interventional deep learning module in MIRACLE, that not only refines predictions but also provides interpretable and actionable insights, allowing domain experts to interactively adjust recommendations based on clinical expertise. We validate our approach on POC-L, a real-world dataset comprising 3,094 lung cancer patients who underwent surgery at Roswell Park Comprehensive Cancer Center. Our results demonstrate that MIRACLE outperforms various traditional machine learning models and contemporary large language models (LLM) variants alone, for personalized and explainable postoperative risk management.
研究の動機と目的
- 肺がん手術における術後合併症の高発生率に対処し、個別化リスク評価を可能にする。
- 構造化臨床データと放射線画像バイオマーカーを統合し予測精度を向上させる。
- ドメイン知識に基づく言語ベースの説明を組み込み、透明性と臨床介入を支援する。
- Roswell Park Comprehensive Cancer CenterのPOC-Lデータセットを用いた実世界検証可能なフレームワークを提供する。
提案手法
- 臨床特徴(c)と放射線特徴(r)の2つのベイズ式MLPエンコーダを用いてd次元埋め込みを生成する。
- 臨床要約S、ドメイン知識ベースK、プロンプトPを用いてLLMベースの所見Mを生成し、凍結テキストエンコーダf_mでMを埋め込む。
- 埋め込みE_c、E_r、E_mを加重和で結合しEを形成し、ベイズMLP分類器を通して合併症確率 ŷを予測する。
- クラス不均衡に対処し予測の不確実性をキャリブレーションするためフォーカル損失で学習する。
- 医師介入パスを提供し、生成された所見Mを臨床医が編集・再埋め込み・再投入することでリアルタイムにŶを更新できる。
実験結果
リサーチクエスチョン
- RQ1臨床データ、放射線学、LLM生成の説明を組み合わせたマルチモーダル統合は肺がん手術の術後合併症予測を改善できるか。
- RQ2LLM生成の説明に対する臨床医介入を可能にすると予測性能と臨床有用性は向上するか。
- RQ3臨床特徴だけと比較して放射線特徴の付加価値はこのタスクでどの程度か。
- RQ4MIRACLEへ統合したオープンソースLLMの予測性能と説明品質はどのように異なるか。
- RQ5MIRACLEフレームワークはトレーニングデータセット(POC-L)を超えて、現実世界の不均衡データに対して一般化可能か。
主な発見
| Model | AUC (%) | TPR(%) @ FPR = 0.2 | TPR(%) @ FPR = 0.3 |
|---|---|---|---|
| Llama 3.3 70B-Instruct | 69.68 | 41.12 | 74.77 |
| DeepSeek R1-Distill Qwen-32B | 64.49 | 54.21 | 56.07 |
| OpenBioLLM-70B | 71.01 | 52.34 | 60.75 |
| Multivariate logistic regression | 80.89 | 73.83 | 80.37 |
| Random Forest Classifier | 77.00 | 62.62 | 74.76 |
| XGBoost | 75.17 | 53.27 | 64.48 |
| Gradient Boosting Classifier | 78.53 | 65.42 | 67.29 |
| LightGBM | 74.77 | 46.73 | 69.16 |
| Surgeons | – | 44.86 | – |
| MIRACLE (DeepSeek R1 distill) | 80.94 | 73.83 | 81.31 |
| MIRACLE (Llama 3.3 70B-Instruct) | 80.84 | 71.03 | 81.31 |
| MIRACLE (OpenBioLLM-70B) | 81.04 | 71.96 | 81.31 |
- MIRACLEはベースラインを上回るAUCを達成し、OpenBioLLM-70Bは81.04%、DeepSeek R1–Distill Qwen-32Bは80.94%のAUCを達成。
- FPR=0.3固定時、MIRACLEは変種全体で最高のTPR 81.31%を達成。
- FPR=0.2時、DeepSeek R1–Distillを用いたMIRACLEは最良の古典的ベースラインTPR 73.83%に匹敵。
- アブレーションにより臨床特徴+放射線特徴はAUCを78.64%へ向上させ、三要素(臨床、放射線、LLM所見)すべてを組み合わせるとAUC 80.94%へ達する。
- 人間の外科医はFPR=0.2でTPR 44.86%を達成し、MIRACLEの性能優位性を強調。
- 放射線学は識別力と感度を著しく向上させ、画像バイオマーカーの有用性を検証。
- 説明チャネルは臨床医が編集してリスク予測に影響を与えることを可能にし、対話的な意思決定支援ワークフローをサポート。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。