Skip to main content
QUICK REVIEW

[論文レビュー] Robust and Scalable Models of Microbiome Dynamics

Travis E. Gibson, Georg K. Gerber|arXiv (Cornell University)|May 11, 2018
Bayesian Methods and Mixture Models参考文献 28被引用数 26
ひとこと要約

本稿では、スパースでノイズが多く、高次元の時系列マイクロバイオームデータから、頑健でスケーラブルかつ解釈可能な微生物相互作用ネットワークを学習するためのベイジアンノンパラメトリックモデルを提案する。相互作用パラメータ数を O(n²) から O((log n)²) に削減し、不確実性を伝搬させ、時間的に変化する補助変数を用いて非負性を強制することで、正確なシステム同定が可能となり、生物学的に妥当でコン act な力学的構造が明らかになる。特に無菌マウスモデルにおける *Clostridium difficile* の既知および新規の有意な阻害因子が同定された。

ABSTRACT

Microbes are everywhere, including in and on our bodies, and have been shown to play key roles in a variety of prevalent human diseases. Consequently, there has been intense interest in the design of bacteriotherapies or "bugs as drugs," which are communities of bacteria administered to patients for specific therapeutic applications. Central to the design of such therapeutics is an understanding of the causal microbial interaction network and the population dynamics of the organisms. In this work we present a Bayesian nonparametric model and associated efficient inference algorithm that addresses the key conceptual and practical challenges of learning microbial dynamics from time series microbe abundance data. These challenges include high-dimensional (300+ strains of bacteria in the gut) but temporally sparse and non-uniformly sampled data; high measurement noise; and, nonlinear and physically non-negative dynamics. Our contributions include a new type of dynamical systems model for microbial dynamics based on what we term interaction modules, or learned clusters of latent variables with redundant interaction structure (reducing the expected number of interaction coefficients from $O(n^2)$ to $O((\log n)^2)$); a fully Bayesian formulation of the stochastic dynamical systems model that propagates measurement and latent state uncertainty throughout the model; and introduction of a temporally varying auxiliary variable technique to enable efficient inference by relaxing the hard non-negativity constraint on states. We apply our method to simulated and real data, and demonstrate the utility of our technique for system identification from limited data and gaining new biological insights into bacteriotherapy design.

研究の動機と目的

  • 高次元でスパースにサンプリングされた、ノイズの多い時系列マイクロバイオームデータから微生物相互作用ネットワークを学習する課題に対処すること。
  • 大規模な微生物集団(n > 300)における O(n²) のペairワイズ相互作用をモデル化する際の計算的・統計的負担を軽減すること。
  • 測定誤差と潜在状態の不確実性をモデル全体にわたって伝搬させる完全ベイジアンフレームワークの構築。
  • 硬い制約なしに物理的に現実的な非負の動的挙動を効率的に推論可能にする。
  • 因果的な微生物動的挙動を明らかにし、細菌療法設計を支援する、コンパクトで生物学的に解釈可能な相互作用モジュールの同定。

提案手法

  • 相互作用パラメータ数を O(n²) から O((log n)²) に削減するため、冗長な相互作用構造を持つ潜在変数のクラスタ(相互作用モジュール)を導入。
  • 測定ノイズ、潜在状態、モデルパラメータの不確実性を伝搬させる完全ベイジアン形式の確率的動的システムを採用。
  • 微生物集団の状態における硬い非負性制約を緩和するため、時間的に変化する補助変数技術を開発し、効率的な MCMC 推論を可能にした。
  • 相互作用モジュールにディリクレ過程(Dirichlet process)を非パラメトリック事前分布として適用し、共有される相互作用パターンに基づく微生物の柔軟なクラスタリングを可能にした。
  • 非線形力学系としての一般化ロトカ・ヴォルテラ(gLV)モデルを用い、対数変換を施したものを基礎とする動的システムとし、MCMC を用いた推論を実施。
  • 16S rRNA 次世代シーケンシングと qPCR のデータを統合し、相対的豊度と全バイオマスをそれぞれ推定するための共同尤度フレームワークを構築。

実験結果

リサーチクエスチョン

  • RQ1スケーラブルで頑健なモデルは、スパースでノイズが多く、高次元の時系列マイクロバイオームデータから正確な微生物相互作用ネットワークを同定できるか?
  • RQ2相互作用モジュールは、複雑な微生物集団をモデル化するにあたり、パラメータ数を削減しつつも生物学的解釈可能性を維持できるか?
  • RQ3提案手法は、非負の動的システムにおいて測定ノイズと潜在状態の不確実性を効果的に伝搬できるか?
  • RQ4モデルは、特に細菌療法設計の文脈において、既知および新規の生物学的に妥当な微生物相互作用を同定できるか?
  • RQ5限られたデータからのシステム同定において、本手法の性能は既存手法と比較して優れているか?

主な発見

  • 実データにおける無菌マウス研究から、中央値として 4 個の相互作用モジュールが同定され、7 個の微生物が支配的かつ一貫したモジュールを形成した。
  • 本モデルは、*Clostridium scindens* が *Clostridium difficile* を阻害する生物学的に妥当な相互作用を検出できたが、元の研究では弱くしか同定されていなかった。
  • 本モデルは、*Akkermansia muciniphila* が病原体の阻害因子である可能性を同定したが、これは腸管粘膜の恒常性を維持するという既存の文献と整合的で生物学的に妥当な候補であった。
  • 相互作用係数の事後分布要約は細かく精巧なネットワーク構造を再現したが、モジュール表現は元の研究の密なネットワークよりもはるかに明確で解釈可能な生物学的画像を提供した。
  • シミュレーションデータにおいて、本手法は限られた非一様なサンプリング条件下でも、元の力学的システムを正確に回復できた。
  • 不確実性の伝搬と補助変数による非負性制約の強制により、高次元でスパースな設定でも安定的かつ効率的な推論が可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。