Skip to main content
QUICK REVIEW

[論文レビュー] Comparative prediction of confirmed cases with COVID-19 pandemic by machine learning, deterministic and stochastic SIR models

Babacar Mbaye Ndiaye, Lena Tendeng|arXiv (Cornell University)|Apr 24, 2020
COVID-19 epidemiological studies参考文献 20被引用数 26
ひとこと要約

本研究では、COVID-19の確定症例数および死亡者数を予測するために、機械学習、決定的SIRモデル、確率的SIRモデルを比較する。2020年1月21日から4月19日までのリアルタイムデータを用い、数値近似法とパラメータ推定を適用してパンデミックの推移を予測した結果、2020年5月10日までに世界の累積確定症例数が370万人を超える可能性があると判明した。また、セネガルでは5月中旬に感染ピークに達すると予測され、イタリアおよびイランでは5月下旬にピークに達すると予測された。中国では楽観的仮定のもとでパンデミックは数週間で終息すると予測された。

ABSTRACT

In this paper, we propose a machine learning technics and SIR models (deterministic and stochastic cases) with numerical approximations to predict the number of cases infected with the COVID-19, for both in few days and the following three weeks. Like in [1] and based on the public data from [2], we estimate parameters and make predictions to help on how to find concrete actions to control the situation. Under optimistic estimation, the pandemic in some countries will end soon, while for most of the countries in the world, the hit of anti-pandemic will be no later than the beginning of May.

研究の動機と目的

  • COVID-19の確定症例数および死亡者数を予測するための機械学習、決定的SIR、確率的SIRモデルの予測性能を比較すること。
  • 現実世界のデータを用いて、感染率β、回復率γなどの主要な疫学的パラメータ、およびボラティリティパラメータσ₁、σ₂を推定すること。
  • ブラウン運動を用いた確率的SIRモデルの導入により、感染伝播における不確実性とランダムネスの影響を評価すること。
  • 特にデータが限られる国(例:セネガル)における公衆衛生政策への実用的予測を提供すること。
  • パンデミックのピーク時刻および累積症例数を予測するための、異なるモデリング手法の有効性を評価すること。

提案手法

  • 伊藤型確率微分方程式を用いた確率的SIRモデルを提案。ブラウン運動を組み込んだ:dS = -βIS dt - σ₁IS dW₁、dI = (βIS - γI) dt + σ₂IS dW₂、dR = γI dt。
  • 人口サイズN = S + I + Rを時間的に維持するためのバランス制約(-σ₁ dW₁ + σ₂ dW₂ = 0)を課す。
  • 公的データソース(例:Tableau COVID-19ダッシュボード)から入手可能な確定症例データを用いて、β、γ、σ₁、σ₂のパラメータ推定に数値近似法を適用する。
  • 6つのモデリング手法を用いる:標準SIR、確率的SIR、死亡者を含むSIR(SIR-D)、死亡者を含むSIR(SIR-F)、潜伏期および待機状態を含むSEWIR-F、およびニューラルネットワークやベイズネットワークを含む機械学習手法。
  • 7日および3週間の予測を比較し、中国、イタリア、イラン、セネガルの国別予測を実施する。
  • ボラティリティの推定に分散ベースの手法を用いる:σ₁ = √(1/n ∑(xᵢ - x̄)²),ここでxᵢ = ln(Iᵢ / Iᵢ₋₁) とし、感染の不確実性をモデル化する。

実験結果

リサーチクエスチョン

  • RQ1機械学習モデルは、確定症例数の予測において、決定的および確率的SIRモデルに比べて予測精度が優れているか?
  • RQ2ブラウン運動を用いた確率的要因の組み込みが、パンデミックのピーク時刻および累積症例数の予測に与える影響は何か?
  • RQ3国ごとに推定されたパラメータ(β、γ、σ₁、σ₂)はどのように変動し、それらは感染対策戦略に何を示唆するか?
  • RQ4ボラティリティ推定を組み込んだ確率的SIRモデルは、特にデータが乏しい地域(例:セネガル)において、感染の不確実性をよりよく捉えられるか?
  • RQ5中国、イタリア、イラン、セネガルのような主要国におけるパンデミックのピーク時刻および終焉予測は何か?

主な発見

  • 2020年5月10日までに、世界の累積確定症例数は374万人を超えると予測され、95%予測区間は351万~442万件である。
  • セネガルでは、パンデミックのピークが2020年5月中旬に達すると予測され、SIRモデルおよび機械学習による予測が一貫した結果を示した。
  • イタリアおよびイランでは、パンデミックのピークが2020年5月下旬に達すると予測され、早期の対策が講じられれば深刻な状況でも制御可能である可能性を示唆した。
  • 中国では楽観的仮定のもとで、パンデミックは数週間で終息すると予測され、2020年4月下旬に感染症例数が安定化すると予測された。
  • 確定症例数に懸念症例および臨床的診断例を含めると、短期的な予測がより深刻なものになると判明した。これは、リスクの高い地域の監視が重要であることを示唆している。
  • ボラティリティ推定を組み込んだ確率的SIRモデルは、特に検査や報告が限られる国々において、不確実性をより現実的に表現できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。