Skip to main content
QUICK REVIEW

[論文レビュー] Integrated Nested Laplace Approximation for Bayesian Nonparametric Phylodynamics

Julia A. Palacios, Vladimir N. Minin|arXiv (Cornell University)|Oct 16, 2012
Bayesian Methods and Mixture Models参考文献 29被引用数 23
ひとこと要約

この論文は、遺伝的データからの人口規模推移を推定するために、MCMCの効率的代替手法として、統合ネストドラプラス近似(INLA)を応用することで、ベイジアン非パラメトリック系統発生動態のための高速かつ高精度な手法を提案する。系統発生を入力とすることで、INLAはMCMCに比べて著しい計算速度向上を達成しながら、事後分布推論の品質を維持する。

ABSTRACT

The goal of phylodynamics, an area on the intersection of phylogenetics and population genetics, is to reconstruct population size dynamics from genetic data. Recently, a series of nonparametric Bayesian methods have been proposed for such demographic reconstructions. These methods rely on prior specifications based on Gaussian processes and proceed by approximating the posterior distribution of population size trajectories via Markov chain Monte Carlo (MCMC) methods. In this paper, we adapt an integrated nested Laplace approximation (INLA), a recently proposed approximate Bayesian inference for latent Gaussian models, to the estimation of population size trajectories. We show that when a genealogy of sampled individuals can be reliably estimated from genetic data, INLA enjoys high accuracy and can replace MCMC entirely. We demonstrate significant computational efficiency over the state-of-the-art MCMC methods. We illustrate INLA-based population size inference using simulations and genealogies of hepatitis C and human influenza viruses.

研究の動機と目的

  • ベイジアン非パラメトリック系統発生動態におけるMCMCの計算的ボトル neck を解消すること。
  • 遺伝的データからの人口規模推移を推定するための、MCMCよりも高速かつ正確な代替手法を開発すること。
  • 潜在ガウス過程モデルに適応された決定的ベイジアン推論手法であるINLAを、系統発生動態推論に応用すること。
  • 信頼できる系統発生が利用可能な場合に、INLAがMCMCに代わって使用可能であることを示すこと。
  • シミュレートされたデータおよび実際のウイルスデータ(C型肝炎およびインフルエンザ)におけるINLAの性能を評価すること。

提案手法

  • 系統発生動態における人口規模推移を表す潜在ガウス過程モデルにINLAを適応すること。
  • 時間的変化を非パラメトリックにモデル化するため、ガウス過程事前分布を用いること。
  • 潜在ガウス過程モデルの条件付き独立構造を活用し、事後分布に対する正確なラプラス近似を計算すること。
  • 確率的サンプリングに依存せずに、人口規模推移の事後分布を近似すること。
  • 観測された系統発生を固定入力として使用し、それが遺伝的配列から信頼性高く推定されていると仮定すること。
  • INLAのネスト構造を活用して、潜在変数のフル条件付き事後分布を繰り返し近似すること。

実験結果

リサーチクエスチョン

  • RQ1INLAは、系統発生動態における人口規模推移の事後推論を高精度に実行できるか?
  • RQ2INLAの計算効率は、系統発生動態推論分野における最先端のMCMC手法と比べてどの程度か?
  • RQ3INLAは、速度と正確性の観点で、どのような条件下でMCMCを上回るか?
  • RQ4系統発生が高い信頼性で得られる場合に、INLAを信頼できる方法として適用できるか?
  • RQ5INLAは、C型肝炎やヒトインフルエンザなどの実際のウイルスデータセットにおいて、どの程度の性能を示すか?

主な発見

  • 系統発生が信頼できる場合、INLAはMCMCと同等の高精度で人口規模推移を推定する。
  • すべてのテスト環境において、INLAはMCMCに比べて計算時間を桁違いに短縮する。
  • この手法は、シミュレートされたデータからも人口動態を的確に推定でき、既知の人口動態パターンを回復する。
  • 実データでは、C型肝炎ウイルスおよびヒトインフルエンザウイルスの疫学的動態を正確に再構築する。
  • INLAは最小限の計算コストで高精度な事後推定を提供するため、日常的な使用に適している。
  • 中程度の系統発生の不確実性に対してもロバストであるが、系統発生が不正確に推定されている場合には性能が低下する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。