Skip to main content
QUICK REVIEW

[논문 리뷰] Differentiated uniformization: A new method for inferring Markov chains on combinatorial state spaces including stochastic epidemic models

Kevin Rupp, Rudolf Schill|arXiv (Cornell University)|2021. 01. 01.
Complex Network Analysis Techniques인용 수 2
한 줄 요약

이 논문은 전이율 행렬 Q의 텐서 곱 구조를 활용하여 조합적 상태공간을 가진 연속시간 마르코프 체인(CTMC)에서 행렬 지수와 그 도함수를 효율적으로 계산하는 새로운 방법인 '미분 가능 균일화(differentiating uniformization)'를 소개한다. 이는 스트로스틱 SIR 전염병 모델과 같은 모델에 적용 가능하며, 계산의 효율성과 수치적 안정성을 보장한다. 본 방법을 통해 감염 및 회복률과 같은 매개변수의 스케일러블하고 수치적으로 안정된 추론이 가능해지며, 오스트리아의 코로나19 첫 번째 유행기 동안의 전체 베이지안 분석을 통해 시간에 따라 변화하는 전파 역학과 불확실성 정량화를 입증하였다.

ABSTRACT

Motivation: We consider continuous-time Markov chains that describe the stochastic evolution of a dynamical system by a transition-rate matrix $Q$ which depends on a parameter $θ$. Computing the probability distribution over states at time $t$ requires the matrix exponential $\exp(tQ)$, and inferring $θ$ from data requires its derivative $\partial\exp\!(tQ)/\partialθ$. Both are challenging to compute when the state space and hence the size of $Q$ is huge. This can happen when the state space consists of all combinations of the values of several interacting discrete variables. Often it is even impossible to store $Q$. However, when $Q$ can be written as a sum of tensor products, computing $\exp(tQ)$ becomes feasible by the uniformization method, which does not require explicit storage of $Q$. Results: Here we provide an analogous algorithm for computing $\partial\exp\!(tQ)/\partialθ$, the differentiated uniformization method. We demonstrate our algorithm for the stochastic SIR model of epidemic spread, for which we show that $Q$ can be written as a sum of tensor products. We estimate monthly infection and recovery rates during the first wave of the COVID-19 pandemic in Austria and quantify their uncertainty in a full Bayesian analysis. Availability: Implementation and data are available at https://github.com/spang-lab/TenSIR.

연구 동기 및 목표

  • 조합적 상태공간을 가진 고차원 CTMC에서 행렬 지수와 그 도함수의 계산 불가능성 문제를 해결하기 위해.
  • 스토스틱 SIR 전염병 모델과 같은 모델에서 거대한 전이율 행렬 Q를 저장하고 계산하는 데 발생하는 과제를 극복하기 위해.
  • 단조적 상태 변화가 필요하지 않은 CTMC의 매개변수 추론을 위한 수치적으로 안정적이고 확장 가능한 방법을 개발하기 위해.
  • 감염률 및 회복률과 같은 전염병 매개변수에 대한 전체 베이지안 추론, 즉 불확실성 정량화를 가능하게 하기 위해.
  • 균일화 방법을 매개변수 도함수 계산으로 확장하여, 태생 과정을 초월한 모델에서도 추론이 가능하도록 하기 위해.

제안 방법

  • 전이율 행렬 Q를 텐서 곱의 합으로 표현하여, Q를 명시적으로 저장하지 않고도 행렬-벡터 곱을 수행할 수 있도록 하기 위해.
  • 행렬 지수 exp(tQ)를 지수 감쇠가 있는 거듭제곱 급수 전개를 통해 균일화 방법을 적용하여 계산하기 위해.
  • 모델 매개변수 θ에 대한 행렬 지수의 도함수를 계산하기 위해 미분 가능 균일화 알고리즘을 유도하기 위해.
  • 급수의 각 단계에서 전체 행렬 연산을 피하기 위해 텐서 구조를 활용하여 P^n p(0)를 효율적으로 계산하기 위해.
  • 시간에 따라 변화하는 매개변수에 대한 전체 베이지안 추론을 위해 하미튼 방식 몽테카를로 샘플링을 구현하기 위해.
  • 원칙적으로 저랭크 텐서 형식을 활용하여, 수백 개의 돌연변이 또는 분할을 가진 모델로도 확장 가능성을 높이기 위해.

실험 결과

연구 질문

  • RQ1조합적 상태공간을 가진 CTMC에서 Q가 너무 크기 때문에 저장할 수 없는 상황에서, 행렬 지수와 그 도함수를 효율적으로 계산할 수 있는가?
  • RQ2Q를 텐서 곱의 합으로 표현함으로써, 일시적 분포와 그 매개변수 민감도의 스케일러블한 계산이 가능한가?
  • RQ3비단조적 과정인 SIR 모델과 같은 경우에서, 미분 가능 균일화가 기존 방법보다 더 일반적인 성능을 보일 수 있는가?
  • RQ4상태공간이 지수적으로 증가하는 상황에서, 시간에 따라 변화하는 전염병 매개변수에 대해 전체 베이지안 추론을 어떻게 수행할 수 있는가?
  • RQ5이 방법은 유사한 조합적 복잡도를 가진 종양 진행 또는 천적-피식자 역학 모델과 같은 다른 모델로도 확장 가능한가?

주요 결과

  • 미분 가능 균일화 방법은 인구 수에 대해 세제곱의 비율로 확장 가능하므로, 지수적 상태공간을 가진 대규모 SIR 모델에도 실용적으로 적용 가능하다.
  • 이 방법을 통해 오스트리아의 코로나19 첫 번째 유행기 동안 월간 감염률 및 회복률에 대한 전체 베이지안 추론이 가능해졌다.
  • 사후 추정치는 2020년 4월에서 8월 사이에 하루당 약 0.07의 회복률(평균 회복 시간 약 2주)을 보였다.
  • 2020년 3월의 추정치는 하루당 약 0.03의 낮은 회복률(1개월 평균 회복)을 보였으며, 이는 회복자 보고의 지연으로 인한 것으로 추정된다.
  • 몇 개월에 걸쳐 매개변수 추정치에 상당한 불확실성이 존재함을 드러내어, 모델-데이터 불일치 또는 비상수 매개변수의 가능성을 시사한다.
  • 이 방법은 텐서 구조를 가진 Q를 가진 다른 CTMC, 예를 들어 종양 진행 및 화학 반응 네트워크 등으로 일반화 가능하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.