Skip to main content
QUICK REVIEW

[論文レビュー] Interpretable Sequence Learning for COVID-19 Forecasting

Sercan Ö. Arık, Chunliang Li|arXiv (Cornell University)|Aug 3, 2020
COVID-19 epidemiological studies参考文献 42被引用数 59
ひとこと要約

本論文は、解釈可能で共変量を組み込んだSEIRベースのモデルを提示し、米国内の州レベルおよび郡レベルでCOVID-19の進行を予測する。いくつかのベンチマークを上回り、説明可能な洞察を提供します。

ABSTRACT

We propose a novel approach that integrates machine learning into compartmental disease modeling to predict the progression of COVID-19. Our model is explainable by design as it explicitly shows how different compartments evolve and it uses interpretable encoders to incorporate covariates and improve performance. Explainability is valuable to ensure that the model's forecasts are credible to epidemiologists and to instill confidence in end-users such as policy makers and healthcare institutions. Our model can be applied at different geographic resolutions, and here we demonstrate it for states and counties in the United States. We show that our model provides more accurate forecasts, in metrics averaged across the entire US, than state-of-the-art alternatives, and that it provides qualitatively meaningful explanatory insights. Lastly, we analyze the performance of our model for different subgroups based on the subgroup distributions within the counties.

研究の動機と目的

  • 共変量をエンコードした学習をSEIR型区画モデルに組み込み、COVID-19の動態を予測する。
  • 実世界の進行を反映するため、未報告ケースと病院リソースを含む区画を拡張する。
  • 時変エンコーダと場所横断の情報共有を通じて時空間一般化を保証する。
  • 既存モデルと比較して予測精度を向上させ、疫学者と政策立案者に対して解釈可能な説明を提供する。

提案手法

  • 未報告および病院関連の区画を追加し、疾病の進行をより正確に捉える。
  • 静的な率を、静的および時変 covariate を転移率へ写像する学習可能なエンコーダに置換する。
  • 解釈性を保ちつつ共変量効果を定量化するため、一般化加法モデル風のエンコーダを採用する。
  • 将来の共変量が利用できない場合は、時変共変量を組み込み、補助モデル(例:XGBoost)を用いて時系列共変量を予測する。
  • 有効再生産数を妥当な範囲に正則化・制約し、2次差分を用いて滑らかなダイナミクスを促す。
  • データ適合・共変量共有・疫学的事前情報をバランスさせる目的関数を用い、部分的教師付き強制などを用いて部分監督データでエンドツーエンド訓練する。
  • 場所間の情報共有メカニズムを含め、局所的バイアスで場所特有のダイナミクスを捉え、局所性への過度の依存を防ぐ正則化項を導入する。

実験結果

リサーチクエスチョン

  • RQ1共変量エンコード型のSEIRフレームワークは、既存モデルと比較して州レベルおよび郡レベルのCOVID-19予測精度を向上させることができるか?
  • RQ2未報告および病院関連の区画は予測と解釈可能性にどのように影響するか?
  • RQ3時変共変量と場所横断の情報共有は、データ不足下で一般化を高めるか?
  • RQ4伝播とアウトカムに対する共変量効果について、どのような解釈可能な洞察を抽出できるか?
  • RQ5政策決定者向けに信頼できる予測区間を提供できるか?

主な発見

Pred. horizon (days)Pred. dateOursCULANLUTYYG
352020-05-1935.871.445.343.746.5
292020-05-2629.458.536.343.837.7
322020-06-0232.886.133.535.126.5
142020-06-0928.871.034.733.522.3
312020-06-1631.479.650.848.932.1
282020-06-2363.8134.785.867.764.2
212020-06-3046.5152.148.634.135.1
  • 提案モデルは、複数の日付における州レベルの14日予測で、いくつかのベンチマークよりMAEが低い。
  • 郡レベルの予測は、複数の予測日でBerkeley CLEPよりMAEが大幅に低い。
  • アブレーション研究は、共変量エンコードエンコーダ、拡張区画、部分的教師フォーシング、最近データでの微調整の利点を示す。
  • モデルは、移動性や介入の伝播率への影響、報告済みと未報告感染の相対的役割などの解釈可能な洞察を提供する。
  • 10th–90th分位点を用いた予測区間が示され、適切にキャリブレーションされており、非滑らかな期間には広がる。
  • 框架は区画遷移と共変量効果を明示的にモデリングすることで、ダイナミクスを説明可能に提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。