[论文解读] Interpretable Sequence Learning for COVID-19 Forecasting
该论文提出一个可解释的、协变量编码的基于SEIR的模型,在美国州和县层面预测COVID-19进展,优于若干基准并提供可解释的洞察。
We propose a novel approach that integrates machine learning into compartmental disease modeling to predict the progression of COVID-19. Our model is explainable by design as it explicitly shows how different compartments evolve and it uses interpretable encoders to incorporate covariates and improve performance. Explainability is valuable to ensure that the model's forecasts are credible to epidemiologists and to instill confidence in end-users such as policy makers and healthcare institutions. Our model can be applied at different geographic resolutions, and here we demonstrate it for states and counties in the United States. We show that our model provides more accurate forecasts, in metrics averaged across the entire US, than state-of-the-art alternatives, and that it provides qualitatively meaningful explanatory insights. Lastly, we analyze the performance of our model for different subgroups based on the subgroup distributions within the counties.
研究动机与目标
- 将协变量编码学习整合到SEIR风格的分区模型中,以预测COVID-19动态。
- 扩展分区以包含未记录病例和医院资源,以反映现实世界的进展。
- 通过时变编码器和跨地点信息共享,确保时空泛化。
- 实现比现有模型更高的预测准确性,并为流行病学家和政策制定者提供可解释的解释。
提出的方法
- 将SEIR扩展为包含未记录和与医院相关的分区,以更好地捕捉疾病进展。
- 用可学习的、由协变量驱动的编码器替代静态比率,将静态和时变协变量映射到转移速率。
- 采用广义加性模型风格的编码器,以保持可解释性并量化协变量效应。
- 在未来协变量不可用时,结合时变协变量并使用辅助模型(如XGBoost)来预测时间序列协变量。
- 对有效再现数进行正则化和约束在合理区间,并通过二阶差分促进平滑动态。
- 端到端训练,使用部分监督数据,结合部分教师强制和在数据拟合、协变量共享与流行病学先验之间的目标平衡。
- 包含跨地点的信息共享机制,带有局部偏置以捕捉地点特有的动态,并加入正则化项以防止过度依赖局部性。
实验结果
研究问题
- RQ1相比现有模型,协变量编码的SEIR框架是否能提高州级和县级的COVID-19预测准确性?
- RQ2未记录和与医院相关的分区如何影响预测和可解释性?
- RQ3在数据有限的情况下,时变协变量和跨地点信息共享是否提升泛化能力?
- RQ4可以提取哪些关于协变量对传播和结果影响的可解释洞察?
- RQ5模型是否能为决策者提供可靠的预测区间?
主要发现
| 预测时长(天) | 预测日期 | 本方案 | CU | LANL | UT | YYG |
|---|---|---|---|---|---|---|
| 35 | 2020-05-19 | 35.8 | 71.4 | 45.3 | 43.7 | 46.5 |
| 29 | 2020-05-26 | 29.4 | 58.5 | 36.3 | 43.8 | 37.7 |
| 32 | 2020-06-02 | 32.8 | 86.1 | 33.5 | 35.1 | 26.5 |
| 14 | 2020-06-09 | 28.8 | 71.0 | 34.7 | 33.5 | 22.3 |
| 31 | 2020-06-16 | 31.4 | 79.6 | 50.8 | 48.9 | 32.1 |
| 28 | 2020-06-23 | 63.8 | 134.7 | 85.8 | 67.7 | 64.2 |
| 21 | 2020-06-30 | 46.5 | 152.1 | 48.6 | 34.1 | 35.1 |
- 所提出的模型在多日期的州级14天预测中,其预测误差(MAE)低于若干基准。
- 县级预测在多个预测日期上显示出显著低于Berkeley CLEP的MAE。
- 消融研究表明,协变量编码编码器、扩展分区、部分教师强制以及对最近数据的微调带来好处。
- 该模型提供可解释的洞察,如移动性和干预对传播速率的影响,以及已记录与未记录感染的相对作用。
- 展示了10th–90th分位数的预测区间,校准良好,在不平滑的时期会扩展。
- 该框架通过明确建模分区转移和协变量效应,提供可解释的动态。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。