[论文解读] From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis
本文提出 GluFormer,一种可推广的基础模型,用于 CGM 数据,能够学习血糖模式并预测更广泛的健康结局,具备强跨队列泛化和风险分层能力,包括饮食模态的多模态性。
Recent advances in SSL enabled novel medical AI models, known as foundation models, offer great potential for better characterizing health from diverse biomedical data. CGM provides rich, temporal data on glycemic patterns, but its full potential for predicting broader health outcomes remains underutilized. Here, we present GluFormer, a generative foundation model for CGM data that learns nuanced glycemic patterns and translates them into predictive representations of metabolic health. Trained on over 10 million CGM measurements from 10,812 adults, primarily without diabetes, GluFormer uses autoregressive token prediction to capture longitudinal glucose dynamics. We show that GluFormer generalizes to 19 external cohorts (n=6,044) spanning different ethnicities and ages, 5 countries, 8 CGM devices, and diverse pathophysiological states. GluFormers representations exceed the performance of current CGM metrics, such as the Glucose Management Indicator (GMI), for forecasting clinical measures. In a longitudinal study of 580 adults with CGM data and 12-year follow-up, GluFormer identifies individuals at elevated risk of developing diabetes more effectively than blood HbA1C%, capturing 66% of all new-onset diabetes diagnoses in the top quartile versus 7% in the bottom quartile. Similarly, 69% of cardiovascular-death events occurred in the top quartile with none in the bottom quartile, demonstrating powerful risk stratification beyond traditional glycemic metrics. We also show that CGM representations from pre-intervention periods in Randomized Clinical Trials outperform other methods in predicting primary and secondary outcomes. When integrating dietary data into GluFormer, we show that the multi-modal version of the model can accurately generate CGM data based on dietary intake data, simulate outcomes of dietary interventions, and predict individual responses to specific foods.
研究动机与目标
- 开发一个可推广的基础模型(GluFormer),用于连续葡萄糖监测(CGM)数据,以捕捉细腻的血糖模式。
- 将 CGM 动态转换为代谢健康的预测表征。
- 展示跨队列泛化能力,覆盖多样人群、设备和病理生理状态。
- 展示在糖尿病和心血管事件的长期风险分层中的实用性。
- 探索整合饮食数据的多模态扩展,以模拟干预和反应。
提出的方法
- 自回归标记预测,以建模纵向 CGM 动态。
- 在 >10 million CGM measurements 来自 10,812 名成年人(主要为非糖尿病患者)上进行训练。
- 在 19 个外部队列(n=6,044)上进行评估,涵盖不同族裔、年龄、国家、设备和条件。
- 将 GluFormer 表征与传统 CGM 指标(如 GMI)进行比较以预测结果。
- 对 580 名参与者进行的纵向分析,12 年随访以评估糖尿病风险预测。
- 整合饮食数据以实现从饮食生成 CGM 并模拟饮食干预的多模态扩展。
实验结果
研究问题
- RQ1在 CGM 数据上训练的基础模型是否能泛化到多样化的外部队列并预测广泛的代谢健康结局?
- RQ2GluFormer 表征在预测临床指标方面是否优于传统 CGM 指标(如 GMI)?
- RQ3基于 CGM 的表征是否能在 HbA1c 和标准指标之外,对新发糖尿病和心血管死亡的风险进行分层?
- RQ4来自随机对照试验的干预前 CGM 数据是否能改善对试验结果的预测?
- RQ5是否可以整合饮食信息以生成 CGM,模拟饮食干预并预测个体对饮食的反应?
主要发现
- GluFormer 能泛化到 19 个外部队列(n=6,044),涵盖多个国家、设备和人群。
- GluFormer 表征在预测临床指标方面超过 Glucose Management Indicator (GMI)。
- 在 12 年纵向研究(n=580)中,CGM 基于的最高四分位风险识别了 66% 的新发糖尿病病例,而底部四分位为 7%。
- 最高四分位的 CGM 表征捕获了 69% 的心血管死亡事件,且底部四分位未出现。
- 随机试验中干预前 CGM 表征在预测主要和次要结果方面优于其他方法。
- 整合饮食数据的多模态版本可以从饮食生成 CGM,模拟饮食干预,并预测个体对食物的反应。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。