Skip to main content
QUICK REVIEW

[논문 리뷰] Turning mechanistic models into forecasters by using machine learning

Amit K. Chakraborty, Hao Wang|arXiv (Cornell University)|2026. 02. 04.
Model Reduction and Neural Networks인용 수 0
한 줄 요약

저자들은 희소 회귀로 발견된 시간에 따라 변화하는 파라미터를 이용해 기계적 ODE 모델을 보강하는 데이터 기반 프레임워크를 개발하고, 이를 ML로 예측해 학습성과 예측 성능을 모두 향상시키며, 네 개의 데이터셋에서 검증하고 CNN-LSTM 및 GBM 기초 모델보다 우수함을 보였다.

ABSTRACT

The equations of complex dynamical systems may not be identified by expert knowledge, especially if the underlying mechanisms are unknown. Data-driven discovery methods address this challenge by inferring governing equations from time-series data using a library of functions constructed from the measured variables. However, these methods typically assume time-invariant coefficients, which limits their ability to capture evolving system dynamics. To overcome this limitation, we allow some of the parameters to vary over time, learn their temporal evolution directly from data, and infer a system of equations that incorporates both constant and time-varying parameters. We then transform this framework into a forecasting model by predicting the time-varying parameters and substituting these predictions into the learned equations. The model is validated using datasets for Susceptible-Infected-Recovered, Consumer--Resource, greenhouse gas concentration, and Cyanobacteria cell count. By dynamically adapting to temporal shifts, our proposed model achieved a mean absolute error below 3\% for learning a time series and below 6\% for forecasting up to a month ahead. We additionally compare forecasting performance against CNN-LSTM and Gradient Boosting Machine (GBM), and show that our model outperforms these methods across most datasets. Our findings demonstrate that integrating time-varying parameters into data-driven discovery of differential equations improves both modeling accuracy and forecasting performance.

연구 동기 및 목표

  • 학습 가능한 진화하는 동적 시스템을 고정 파라미터 기계적 모델 너머로 학습해야 할 필요성을 동기화한다.
  • 시간에 따라 변해야 하는 파라미터를 식별하기 위한 two-stage SINDy 기반 접근법을 도입한다.
  • 시간에 따라 변하는 파라미터를 예측하여 예측에 통합하고 예측을 향상시킨다.
  • 예측된 시간 의존 파라미터를 학습된 ODE에 대입하여 예측 기능을 입증한다.

제안 방법

  • 상태 및 입력 변수로부터 총 차수가 d 이하인 후보 함수 라이브러리를 구성한다.
  • 비선형 동역학의 희소 식별(SINDy)을 두 단계로 적용하여 상수 계수와 시간에 따라 변하는 계수를 식별한다.
  • 롤링 윈도우 내에서 계수를 시간에 따라 변하는 것으로 간주하는 상위 N개의 활성 항들을 선택하고, 나머지 항은 상수로 유지한다.
  • 외생 공변량에 의해 구동되는 기계 학습 모델로 시간에 따라 변하는 계수를 예측한다.
  • 예측된 파라미터를 사용해 ODE의 오른쪽 항을 업데이트하여 예측을 생성한다.
  • 데이터셋 전반에 대해 CNN-LSTM 및 GBM 기초 모델과 예측 성능을 비교한다.

실험 결과

연구 질문

  • RQ1시간에 따라 변하는 파라미터가 상수 계수 SINDy와 비교했을 때 모델 적합도와 예측 정확도를 향상시킬 수 있는가?
  • RQ2시간에 따라 변해야 하는 파라미터를 어떻게 효율적으로 식별할 수 있는가?
  • RQ3공변량으로부터 시간에 따라 변하는 파라미터를 얼마나 정확하게 예측할 수 있으며, 이것이 상태 예측에 어떤 영향을 미치는가?
  • RQ4제안된 프레임워크가 시뮬레이션 및 실제 시스템(SIR, CR, GHG 농도, 남세균)에서 일반화되는가?

주요 결과

  • 시계열 학습에서의 평균 절대 오차는 3% 미만이고, 1개월 ahead까지의 예측은 6% 미만이다.
  • 해당 프레임워크는 일부 파라미터를 변동시키고 다른 파라미터는 고정시킴으로써 시간적 변화에 적응한다.
  • 대부분의 데이터셋에서 이 방법은 CNN-LSTM 및 GBM 기초 모델보다 우수하다.
  • 시간에 따라 변하는 파라미터의 통합은 테스트된 시스템(SIR, CR, GHG 농도, 남세균 수)에 대해 모델링 정확도와 예측 성능을 모두 개선한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.