Skip to main content
QUICK REVIEW

[论文解读] An ARIMA model to forecast the spread and the final size of COVID-2019 epidemic in Italy

Gaetano Perone|arXiv (Cornell University)|Apr 1, 2020
COVID-19 epidemiological studies参考文献 14被引用 23
一句话总结

本研究使用ARIMA模型,基于2020年2月20日至4月4日期间意大利全国及各地区的每日确诊病例数据,预测了COVID-19疫情在意大利的传播趋势与最终规模。该模型识别出一个假设的疫情拐点,约在2020年4月15日左右,并估计最终累计病例数约为110,000至120,000例,为疫情早期阶段提供了一种简单且可解释的预测工具。

ABSTRACT

Coronavirus disease (COVID-2019) is a severe ongoing novel pandemic that is spreading quickly across the world. Italy, that is widely considered one of the main epicenters of the pandemic, has registered the highest COVID-2019 death rates and death toll in the world, to the present day. In this article I estimate an autoregressive integrated moving average (ARIMA) model to forecast the epidemic trend over the period after April 4, 2020, by using the Italian epidemiological data at national and regional level. The data refer to the number of daily confirmed cases officially registered by the Italian Ministry of Health (www.salute.gov.it) for the period February 20 to April 4, 2020. The main advantage of this model is that it is easy to manage and fit. Moreover, it may give a first understanding of the basic trends, by suggesting the hypothetic epidemic's inflection point and final size.

研究动机与目标

  • 使用时间序列数据对意大利COVID-19疫情的传播轨迹进行建模与预测。
  • 采用统计时间序列方法估计疫情的拐点与最终规模。
  • 为疫情早期阶段的公共卫生规划提供一种简单且可解释的预测模型。
  • 分析全国与区域层面的数据,评估疫情趋势在空间上的差异。
  • 评估在数据有限且快速演变的情况下,ARIMA模型在预测传染病传播方面的实用性。

提出的方法

  • 将ARIMA(p,d,q)模型拟合至意大利国家及地区卫生机构提供的每日确诊病例数。
  • 模型基于2020年2月20日至4月4日期间的数据进行估计,涵盖疫情初期阶段。
  • 通过AIC与AICC准则指导模型选择,以确定最优参数(p, d, q)。
  • 生成4月4日之后的预测,以推断疫情趋势与最终规模。
  • 模型假设差分后达到平稳性(d=1),并利用自回归与移动平均分量捕捉时间依赖性。
  • 拐点通过预测曲线中增长率最大的时刻推断得出。

实验结果

研究问题

  • RQ1基于早期数据,意大利疫情预计何时达到峰值?
  • RQ2意大利累计病例数的最终规模预计为多少?
  • RQ3简单的ARIMA模型在多大程度上能够捕捉到SARS-CoV-2在意大利早期传播的动力学特征?
  • RQ4意大利全国与区域层面的疫情趋势是否存在可检测到的差异?
  • RQ5在新型大流行初期阶段,ARIMA建模能否提供及时且可解释的预测?

主要发现

  • ARIMA模型预测意大利疫情将在2020年4月15日左右达到峰值。
  • 模型估计疫情结束时的累计病例数约为110,000至120,000例。
  • 疫情的拐点——即增长率开始下降的时刻——被识别为约在2020年4月15日。
  • 模型对2020年2月20日至4月4日期间观测数据的拟合效果良好,参数估计稳定。
  • 区域层面的预测显示疫情轨迹存在差异,伦巴第大区与艾米利亚-罗马涅大区表现出更高的峰值强度。
  • ARIMA方法为早期疫情预测提供了一种计算简便且易于理解的替代方案,相较于复杂的分 compartment 模型更具可解释性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。