Skip to main content
QUICK REVIEW

[論文レビュー] Scalable Multiple Network Inference with the Joint Graphical Horseshoe

Camilla Lingjærde, Benjamin P. Fairfax|arXiv (Cornell University)|Jun 23, 2022
Bioinformatics and Genomic Networks被引用数 3
ひとこと要約

本稿では、ベイジアングラフィカルホークシュー推定のためのスケーラブルな期待条件付き最大化(ECM)アルゴリズムを提案し、複数のネットワーク推定のための共同グラフィカルホークシューを導入する。エッジ固有の縮小とネットワーク間の情報共有を活用することで、特に共有および特異なネットワーク構造を有する高次元のマルチコンディションオミックスデータにおいて、従来手法に比べて優れた精度とスケーラビリティを達成する。

ABSTRACT

Network models are useful tools for modelling complex associations. In statistical omics, such models are increasingly popular for identifying and assessing functional relationships and pathways. If a Gaussian graphical model is assumed, conditional independence is determined by the non-zero entries of the inverse covariance (precision) matrix of the data. The Bayesian graphical horseshoe estimator provides a robust and flexible framework for precision matrix inference, as it introduces local, edge-specific parameters which prevent over-shrinkage of non-zero off-diagonal elements. However, its applicability is currently limited in statistical omics settings, which often involve high-dimensional data from multiple conditions that might share common structures. We propose (i) a scalable expectation conditional maximisation (ECM) algorithm for the original graphical horseshoe, and (ii) a novel joint graphical horseshoe estimator, which borrows information across multiple related networks to improve estimation. We show numerically that our single-network ECM approach is more scalable than the existing graphical horseshoe Gibbs implementation, while achieving the same level of accuracy. We also show that our joint-network proposal successfully leverages shared edge-specific information between networks while still retaining differences, outperforming state-of-the-art methods at any level of network similarity. Finally, we leverage our approach to clarify gene regulation activity within and across immune stimulation conditions in monocytes, and formulate hypotheses on the pathogenesis of immune-mediated diseases.

研究の動機と目的

  • 高次元のベイジアングラフィカルホークシュー・モデルにおけるギブスサンプリングの計算上的非現実性に対処すること。
  • オミックス応用における単一および複数のガウス・グラフィカル・モデルのスケーラブルな推定を可能にすること。
  • 関連するネットワーク間で情報を取り込むが、条件特異的な差を保ちながら、統合的モデリングフレームワークを構築すること。
  • スパースなエッジ選択において高い信頼性を持つ特定エッジの推定精度を向上させること。

提案手法

  • グラフィカルホークシューにおける精度行列の後部確率推定のためのECMアルゴリズムを提案し、計算コストの高いギブスサンプリングに代わる。
  • 複数のネットワーク間でグローバルおよびローカルの縮小パラメータを共有する階層ベイジアンモデルとして、共同グラフィカルホークシューを導入する。
  • 非ゼロエッジの過剰な縮小を防ぐために、精度行列の非対角成分にグローバルローカルホークシュー事前分布を用いる。
  • ECMアルゴリズムを用いて後部確率を反復的に最大化し、高次元設定下での効率的計算を可能にする。
  • ネットワーク間の類似性と不一致をバランスさせるために、共有および条件特異的ハイパーパrameterを組み込む。
  • 単一および共同ネットワーク推定のためのRパッケージであるfastGHSおよびjointGHSを提供する。

実験結果

リサーチクエスチョン

  • RQ1ECMに基づく推定手順は、グラフィカルホークシューのスケーラビリティを向上させつつ、精度を維持できるか?
  • RQ2共同グラフィカルホークシューは、複数の条件下で共有されるネットワーク構造を効果的に活用できるか、かつ条件特異的な差を損なわないか?
  • RQ3多様なネットワーク類似度の状況下で、共同グラフィカルホークシューは最先端の手法に比べてどの程度の性能を示すか?
  • RQ4本手法は、特に免疫刺激下での遺伝子調節ネットワークの同定において、実世界のオミックスデータでどの程度の性能を示すか?

主な発見

  • fastGHSのECMアルゴリズムは、ギブスサンプリングと同等の精度を達成するが、はるかにスケーラブルであり、現実的なオミックスデータサイズでの推定を可能にする。
  • jointGHSは、すべてのネットワーク類似度レベルでJGL、SSJGL、GemBagを一貫して上回り、AUPRC0.3スコアが0.3に近く、偽陽性が最小限に抑えられている。
  • p = 200ノードおよび100%のネットワーク不一致を想定したシミュレーションでは、jointGHSのAUPRC0.3は0.296を維持し、JGL(0.284)およびSSJGL(0.292)を上回った。
  • 本手法はエッジ選択において高い精度を示し、追加エッジの証拠が不足している場合にのみ再現率が急激に低下するため、スパース推定において頑健であることが示された。
  • jointGHSのCPU時間はpに対して準2乗関数的に増加し、2条件の1000ノードネットワークへの推定が可能である。
  • モノサイトの免疫刺激データへの応用により、生物学的に妥当な遺伝子調節ネットワークが同定され、免疫媒介疾患の発症機構に関する新たな仮説が得られた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。