[论文解读] Network-Based Prediction of the 2019-nCoV Epidemic Outbreak in the Chinese Province Hubei
本文提出一种基于网络的 SIR 模型,通过从观测数据中推断城际感染概率来预测湖北省城市层面的 2019-nCoV 暴发,并与逻辑回归进行比较。
At the moment of writing (12 February, 2020), the future evolution of the 2019-nCoV virus is unclear. Predictions of the further course of the epidemic are decisive to deploy targeted disease control measures. We consider a network-based model to describe the 2019-nCoV epidemic in the Hubei province. The network is composed of the cities in Hubei and their interactions (e.g., traffic flow). However, the precise interactions between cities is unknown and must be inferred from observing the epidemic. We propose a network-based method to predict the future prevalence of the 2019-nCoV virus in every city. Our results indicate that network-based modelling is beneficial for an accurate forecast of the epidemic outbreak.
研究动机与目标
- 为在城市层面准确预测湖北省 2019-nCoV 爆发提供动机。
- 开发一个网络基的 SIR 模型,其中城际互动从数据中推断。
- 估计城市级治愈和感染概率以预测未来的流行程度。
- 在基线逻辑回归的对比下评估预测准确性。
提出的方法
- 使用在每个城市的离散时间 SIR 模型,并引入城际感染矩阵 B。
- 通过在候选值网格中选择并拟合数据来推断治愈概率 delta_i。
- 将 beta_ij 的推断表述为线性系统 V_i = F_i * beta_i,且 beta 约束在 0-1。
- 应用 LASSO(L1)正则化来估计 beta_ij,同时避免过拟合。
- 对感染数据进行预处理,将报告的感染转化为传染性分数并进行平滑处理。
- 通过对所需预测 horizon 重复推断的 SIR 模型来预测未来暴发。
实验结果
研究问题
- RQ1在未知城际交互的情况下,基于网络的 SIR 模型是否能够准确预测湖北省城市层面的暴发轨迹?
- RQ2与基线方法相比,基于 LASSO 的网络推断在从观测数据中恢复城际感染概率方面的表现如何?
主要发现
| 标识符 | 城市 | Feb12 | Feb13 | Feb14 | Feb15 | Feb16 |
|---|---|---|---|---|---|---|
| 1 | Wuhan | 19826 | 20981 | 22064 | 23084 | 24052 |
| 2 | Huanggang | 2465 | 2530 | 2596 | 2662 | 2728 |
| 3 | Jingzhou | 1145 | 1177 | 1209 | 1240 | 1271 |
| 4 | Xiangyang | 1119 | 1149 | 1179 | 1209 | 1239 |
- 相比逻辑回归,在不同预测 horizon 的误差指标上,基于网络的方法更具预测准确性。
- 预测准确性随着预测 horizon 的增加而下降,但随着时间累积数据的增多而改善。
- 对未来几天的城市级预测显示出与观测数据一致的合理增长模式。
- 在没有任何先验城际互动知识的情况下,该方法仍通过数据驱动的网络推断产出可用的预测。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。