[論文レビュー] TWIN-GPT: Digital Twins for Clinical Trials via Large Language Model
TWIN-GPT は微調整済みの大規模言語モデルを活用して患者の個別デジタルツインを作成し、仮想臨床試験の予測を改善し、ハイフィデリティでプライバシー保護された合成EHRデータを実現します。
Clinical trials are indispensable for medical research and the development of new treatments. However, clinical trials often involve thousands of participants and can span several years to complete, with a high probability of failure during the process. Recently, there has been a burgeoning interest in virtual clinical trials, which simulate real-world scenarios and hold the potential to significantly enhance patient safety, expedite development, reduce costs, and contribute to the broader scientific knowledge in healthcare. Existing research often focuses on leveraging electronic health records (EHRs) to support clinical trial outcome prediction. Yet, trained with limited clinical trial outcome data, existing approaches frequently struggle to perform accurate predictions. Some research has attempted to generate EHRs to augment model development but has fallen short in personalizing the generation for individual patient profiles. Recently, the emergence of large language models has illuminated new possibilities, as their embedded comprehensive clinical knowledge has proven beneficial in addressing medical issues. In this paper, we propose a large language model-based digital twin creation approach, called TWIN-GPT. TWIN-GPT can establish cross-dataset associations of medical information given limited data, generating unique personalized digital twins for different patients, thereby preserving individual patient characteristics. Comprehensive experiments show that using digital twins created by TWIN-GPT can boost the clinical trial outcome prediction, exceeding various previous prediction approaches.
研究の動機と目的
- データ不足と患者のばらつきに対して臨床試験のアウトカム予測の改善を動機づける。
- LLMsの世界知識を活用してEHRベースの予測におけるデータギャップとデータの一貫性の欠如に対処する。
- 試験期間を通じた個々の患者の軌跡を反映する個別化デジタルツインを開発する。
- 実際の記録を使用するのではなく仮想的な患者データを生成することによってプライバシー保護を確保する。
提案手法
- 臨床試験データ上で事前学習済みLNM (ChatGPT) を微調整して個別化された患者デジタルツインを生成する。
- 治療、薬剤、および有害事象を跨ぐマルチホットイベントベクトルとして患者訪問を表現する。
- K-nearest neighbors を用いて双子生成を通知し、個別の軌道のイン-context学習を可能にする。
- 時点とイベントをまたぐ患者データの関係を学ぶために、二つの交互的な微調整タスクで学習する。
- 代替治療シナリオをシミュレートするために、個別化されたデジタルツインとカウンターファクトリアルなツインを生成する。
- 次元別確率、カウンターファクトリアル類似度、および重篤なアウトカムのAUROCで忠実度を評価する。
実験結果
リサーチクエスチョン
- RQ1LLMs は個々の患者に対して正確で個別化されたデジタルツインを作成し、試験アウトカム予測を改善できるか。
- RQ2LLM生成ツインはプライバシーを保護しつつ、EHRのデータギャップと不整合に対処できるか。
- RQ3合成ツインは実世界のイベント分布をどの程度再現し、臨床試験におけるカウンターファクト分析をどの程度支援できるか。
- RQ4デジタルツインが副作用および重篤アウトカムの予測に及ぼす影響は、ベースラインと比べてどの程度か。
主な発見
- TWIN-GPT は実データに対する相対的に、いくつかのベースラインよりも副作用分布の忠実度が高い。
- 本モデルは個別化治療効果を推定するためのカウンターファクトリアルツインの生成を可能にする。
- 評価には次元別確率整合とピアソン相関に基づく忠実度が含まれる。
- 重篤アウトカムの予測は、訓練およびテストにおいて合成データと実データを用いたAUROCで評価される。
- プライバシーリスク評価には存在開示、属性開示、およびNNAAベースの過学習リスクを含む。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。