Skip to main content
QUICK REVIEW

[논문 리뷰] Horseshoe‐based Bayesian nonparametric estimation of effective population size trajectories

James R. Faulkner, Andrew F. Magee|arXiv (Cornell University)|2018. 08. 13.
Genetic and phenotypic traits in livestock참고 문헌 63인용 수 27
한 줄 요약

이 논문은 유전적 데이터를 사용하여 효율적 인구 크기 궤적을 추정하기 위한 새로운 베이지안 비모수적 방법인 HSMRF를 제안한다. 로그 변환된 인구 크기를 말뚝 마르코프 무작위장 필드 사전분포로 모델링하여 국소적 적응성을 확보함으로써 급격한 변화와 다양한 부드러움 수준을 잘 포착할 수 있다. 시뮬레이션과 실제 데이터에서 기존의 가우시안 프로세스 모델과 변화점 모델보다 더 낮은 편향과 높은 정밀도를 보이며 성능을 뛰어나게 한다.

ABSTRACT

Phylodynamics is an area of population genetics that uses genetic sequence data to estimate past population dynamics. Modern state-of-the-art Bayesian nonparametric methods for recovering population size trajectories of unknown form use either change-point models or Gaussian process priors. Change-point models suffer from computational issues when the number of change-points is unknown and needs to be estimated. Gaussian process-based methods lack local adaptivity and cannot accurately recover trajectories that exhibit features such as abrupt changes in trend or varying levels of smoothness. We propose a novel, locally-adaptive approach to Bayesian nonparametric phylodynamic inference that has the flexibility to accommodate a large class of functional behaviors. Local adaptivity results from modeling the log-transformed effective population size a priori as a horseshoe Markov random field, a recently proposed statistical model that blends together the best properties of the change-point and Gaussian process modeling paradigms. We use simulated data to assess model performance, and find that our proposed method results in reduced bias and increased precision when compared to contemporary methods. We also use our models to reconstruct past changes in genetic diversity of human hepatitis C virus in Egypt and to estimate population size changes of ancient and modern steppe bison. These analyses show that our new method captures features of the population size trajectories that were missed by the state-of-the-art methods.

연구 동기 및 목표

  • 기존의 베이지안 비모수적 방법이 급격한 변화나 다양한 부드러움 수준을 가진 궤적을 정확히 복원하지 못하는 한계를 해결하기 위해.
  • 변화점 모델의 장점(국소적 적응성)과 가우시안 프로세스 사전분포의 장점(부드러움)을 결합하면서도 계산적 및 모델링적 결함을 피할 수 있는 방법을 개발하기 위해.
  • 유전계승과 인구 크기 궤적을 함께 추정할 수 있는 완전한 베이지안 프레임워크를 제공하여 정확성과 불확실성 측정을 향상시키기 위해.

제안 방법

  • 이 방법은 효율적 인구 크기의 로그 변환값을 말뚝 마르코프 무작위장(HSMRF) 사전분포로 모델링하며, 이는 일부 계수를 정확히 0으로 설정함으로써 국소적 적응성을 가능하게 하는 수축 기반 사전분포이다.
  • HSMRF 사전분포는 공생 이벤트의 이산 시간 그리드에 적용되어, 고정된 결합점 위치나 변화점 수를 사전에 지정하지 않고도 비모수적 인구 크기 궤적 추정이 가능하다.
  • 이 접근법은 HSMRF의 공간적 의존성에 대해 조건부 자료회귀(CAR) 구조를 사용하는 계층적 베이지안 모델을 사용하여 영리한 스무딩과 수축을 가능하게 한다.
  • 사후 추론은 마르코프 체인 몬테카를로(MCMC) 샘플링을 통해 수행되며, 인구 크기 궤적과 하이퍼파rameter를 포함한 모든 매개변수에 대한 조건부 분포가 유도된다.
  • 이 방법은 GitHub에 공개된 R 패키지 spmrf를 통해 구현되었으며, 고정된 유전계승과 추정된 유전계승을 모두 지원한다.
  • 이차 HSMRF와 GMRF 모델이 도입되었으며, 후자는 더 부드러운 궤적과 복잡한 역학을 보이는 시뮬레이션 데이터에서 향상된 성능을 보였다.

실험 결과

연구 질문

  • RQ1기존의 방법보다 베이지안 비모수적 방법이 급격한 변화나 다양한 부드러움 수준을 가진 궤적을 더 정확하고 적응적으로 추정할 수 있는가?
  • RQ2편향, 정밀도, 그리고 복잡한 인구역학적 특징을 복원하는 능력 측면에서 HSMRF 사전분포는 가우시안 프로세스 모델과 변화점 모델보다 어떻게 비교되는가?
  • RQ3이차 HSMRF 모델은 일차 모델에 비해 다양한 수준의 부드러움을 가진 인구역학 역학을 포착하는 데 어떻게 성능을 발휘하는가?
  • RQ4HSMRF 방법은 기존 최첨단 방법들이 놓친 바이오로지컬적으로 의미 있는 인구역학적 사건—예를 들어 인구 감소나 확장—을 더 잘 복원할 수 있는가?
  • RQ5실제 바이러스 및 고대 DNA 데이터셋에 적용했을 때 HSMRF 방법은 강건성과 계산 가능성 유지가 가능한가?

주요 결과

  • 시뮬레이션 결과, HSMRF 방법은 특히 급격한 변화를 보이는 궤적을 복원할 때 기존의 가우시안 마르코프 무작위장(GMRF) 모델과 변화점 기반 스킴블 모델보다 편향이 낮고 정밀도가 높았다.
  • HSMRF-1 모델은 빙하기 후퇴와 베링아메리카에 인간의 도착 등의 알려진 인구역학적 사건과 더 잘 일치하는 더 복잡한 궤적을 생성했다.
  • Egyptians에서의 간염 C 바이러스 데이터 분석에서, HSMRF 모델은 GMRF 및 스킴블 모델보다 더 세밀한 유전적 다양성 감소를 포착하여 미세한 인구역학적 동역학을 더 잘 탐지할 수 있음을 시사했다.
  • 스테프 바이슨 데이터에서 HSMRF-1 모델은 41.6~47.3kya 사이에 인구 크기 정점으로 추정했으며, GMRF-1 모델보다 더 높은 사후 모델 확률을 기록하여 데이터에 더 잘 맞는 것으로 나타났다.
  • 시뮬레이션과 실제 데이터 사례에서 이차 HSMRF 모델은 일차 모델보다 성능이 뛰어나며, 더 높은 사후 모델 확률을 보였으며, 이는 더 부드러운 궤적을 위한 유용성을 시사한다.
  • HSMRF 방법은 최첨단 방법들이 놓친 요소—빠른 감소와 국소적 변동—을 잘 포착하여, 비정상적이고 이질적인 인구역학 패턴을 모델링하는 데서의 열등성을 드러냈다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.