Skip to main content
QUICK REVIEW

[論文レビュー] Exploring Memory Effects: Sparse Identification in Vector-Borne Diseases

Dimitri Breda, Muhammad Tanveer|arXiv (Cornell University)|Jan 28, 2026
Viral Infections and Vectors被引用数 0
ひとこと要約

この論文はSINDyを拡張し、ベクター媒介性疾患伝播における分布記憶(遅延)ダイナミクスを発見する。DalianのSFTSに incidence と temperature データを用いて実証。データ駆動の疎な積分表現が、機械的成分と結合した場合に短期予測を改善することを示す。

ABSTRACT

Predicting the human burden of vector-borne diseases from limited surveillance data remains a major challenge, particularly in the presence of nonlinear transmission dynamics and delayed effects arising from vector ecology and human behavior. We develop a data-driven framework based on an extension of Sparse Identification of Nonlinear Dynamics (SINDy) to systems with distributed memory, enabling discovery of transmission mechanisms directly from time series data. Using severe fever with thrombocytopenia syndrome (SFTS) as a case study, we show that this approach can uncover key features of tick-borne disease dynamics using only human incidence and local temperature data, without imposing predefined assumptions on human case reporting. We further demonstrate that predictive performance is substantially enhanced when the data-driven model is coupled with mechanistic representations of tick-host transmission pathways informed by empirical studies. The framework supports systematic sensitivity analysis of memory kernels and behavioral parameters, identifying those most influential for prediction accuracy. Although the approach prioritizes predictive accuracy over mechanistic transparency, it yields sparse, interpretable integral representations suitable for epidemiological forecasting. This hybrid methodology provides a scalable strategy for forecasting vector-borne disease risk and informing public health decision-making under data limitations.

研究の動機と目的

  • データ制約と不確かな記憶効果の下でのベクター媒介性疾患の短期予測を動機づける。
  • 時系列データから分布記憶カーネルを発見可能な、データ駆動のSINDy拡張を開発する。
  • 機械的結合を用いて、SFTSをDalianで人間の罹患率と局所温度を用いて framework を適用し、予測性能を向上させる。
  • 記憶カーネルと行動パラメータの感度を評価して、予測精度の推進要因を同定する。
  • データ制約下での疫学予測に適した、解釈可能で疎な積分表現を提供する。

提案手法

  • 分布記憶を有するシステムへSINDyを拡張し、 renewal 方程式と積分カーネルを用いる。
  • 分布遅延積分を候補関数の加重和へ変換するための quadrature ベースの近似を構築する。
  • 遅延ノードと遅延状態経路に依存する候補関数のライブラリを構築し、e^{ωT} のような非 autonomous 項や多項式相互作用を含める。
  • 各状態成分のカーネル内の活性項の最小集合を同定するための疎回帰(STLS/LASSO)を解く。
  • データ駆動のカーネルを機械的成分( tick- host transmission path)と結合して予測性能を向上させる。
  • 月次のSFTS罹患率と温度データでモデルを評価し、拡張分析では感染 ticks 集団を含めてライブラリを充実させる。

実験結果

リサーチクエスチョン

  • RQ1SINDyを拡張して、ベクター媒介性疾患伝播における時系列データから分布記憶カーネルを同定できるか。
  • RQ2限られた人間の罹患データと温度データを用いて、データ駆動カーネルが tick- host–人間の伝播ダイナミクスをどの程度再現できるか。
  • RQ3e^{ωT} のような非 autonomous 記憶項を組み込むと、SFTS罹患の短期予測が改善されるか。
  • RQ4感染 tick 集団データを含めると、記憶カーネルと予測精度にどのような影響があるか。
  • RQ5記憶カーネルと報告ウィンドウパラメータ(sigma)の感度はSFTSの予測精度にどの程度影響するか。

主な発見

  • 分布遅延SINDyフレームワークは、 past incidence、temperature、活動を現在の症例へ結びつける疎で解釈可能なカーネルを同定できる。
  • 2つのモデル変種を評価: baseline memory model と、外的活動項 e^{ωT} を組み込んだもの、多項式ライブラリは degree 1–2 まで。
  • 温度駆動の外的活動を含めると、基準と同様に予測性能が向上し、いくつかのケースで degree-1 の多項式が最良となる。
  • 感染 ticks 集団(I_Nq, I_Aq)をライブラリに追加するとさらなる改善が得られ、tick-状態項を含む疎なカーネルが得られる。
  • この手法はSFTS罹患の季節性を捉え、限られた訓練データ(96 monthly samples)を考慮すると妥当な RMSE を提供する。
  • 感度分析は outdoor-activity パラメータ ω と積分ウィンドウ σ が検証誤差に与える影響を示し、頑健なパラメータ選択を導く。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。