Skip to main content
QUICK REVIEW

[論文レビュー] Comparison between instrumental variable and mediation-based methods for reconstructing causal gene networks in yeast

Adriaan-Alexander Ludl, Tom Michoel|arXiv (Cornell University)|Oct 14, 2020
Bioinformatics and Genomic Networks参考文献 42被引用数 6
ひとこと要約

本研究は、1,012株の大型交配系統と YEASTRACT からの真のデータを用いて、イーストにおける因果的遺伝子ネットワークの再構築に関して、インストゥルメンタル変数(IV)法と媒介効果に基づく手法を比較した。IV法は感度が高かったが、ゲノム連鎖による偽陽性を示した。一方、媒介効果に基づく手法は大規模なサンプルサイズで性能が飽和し、STB5のような自己調節遺伝子を漏れてしまうが、転写のホットスポットで DNM1 のような新たな候補を同定した。

ABSTRACT

Causal gene networks model the flow of information within a cell, but reconstructing them from omics data is challenging because correlation does not imply causation. Combining genomics and transcriptomics data from a segregating population allows to orient the direction of causality between gene expression traits using genomic variants. Instrumental-variable methods (IV) use a local expression quantitative trait locus (eQTL) as a randomized instrument for a gene's expression level, and assign target genes based on distal eQTL associations. Mediation-based methods (ME) additionally require that distal eQTL associations are mediated by the source gene. Here we used Findr, a software providing uniform implementations of IV, ME, and coexpression-based methods, a recent dataset of 1,012 segregants from a cross between two budding yeast strains, and the YEASTRACT database of known transcriptional interactions to compare causal gene network inference methods. We found that causal inference methods result in a significant overlap with the ground-truth, whereas coexpression did not perform better than random. A subsampling analysis revealed that the performance of ME decreases at large sample sizes, due to a loss of sensitivity when residual correlations become significant. IV methods contain false positive predictions, due to genomic linkage between eQTL instruments. IV and ME methods also have complementary roles for identifying causal genes underlying transcriptional hotspots. IV methods correctly predicted STB5 targets for a hotspot centred on the transcription factor STB5, whereas ME failed due to Stb5p auto-regulating its own expression. ME suggests a new candidate gene, DNM1, for a hotspot on Chr XII, where IV methods could not distinguish between multiple genes located within the hotspot.

研究の動機と目的

  • イーストにおける因果的遺伝子ネットワーク再構築のためのインストゥルメンタル変数法と媒介に基づく手法を比較すること。
  • イースト交配から得られた1,012株の大型で高分解能のデータセットを用いて性能を評価すること。
  • YEASTRACTデータベースから得た真のネットワークを基準に、各手法の性能を評価すること。
  • サンプルサイズの増加が、媒介に基づく手法の性能に与える影響を調査すること。
  • IV法におけるゲノム連鎖や、媒介解析における残差相関といった限界を同定すること。

提案手法

  • Findr と呼ばれるソフトウェアパッケージを用い、IV法、媒介法、共発現に基づく手法の統一された実装を提供した。
  • 遺伝子発現のための局所的 eQTL をランダム化された道具として用いて、インストゥルメンタル変数法を適用した。
  • 遠隔 eQTL 関連が元の遺伝子によって媒介されることを前提とした、媒介に基づく手法を適用した。
  • サンプルサイズの増加に伴う性能の飽和を評価するために、サブサンプリング解析を実施した。
  • 統計的検定を統合して因果ネットワークを推定するために、後部確率(1 - 局所的誤発見率)を用いた。
  • 既知の転写的相互作用を含む YEASTRACT データベースと照合して結果を検証した。

実験結果

リサーチクエスチョン

  • RQ1多オミクスデータからイーストにおける因果的遺伝子ネットワークを再構築するにあたり、インストゥルメンタル変数法と媒介に基づく手法はどのように比較されるか?
  • RQ2サンプルサイズの増加が、媒介に基づく因果推論の性能に与える影響は何か?
  • RQ3ゲノム連鎖が存在する状況で、なぜインストゥルメンタル変数法が偽陽性予測を生じるのか?
  • RQ4IV法が失敗する転写のホットスポットにおいて、媒介に基づく手法は新たな因果的ターゲットを同定できるか?
  • RQ5残差相関と多効果性は、それぞれの手法の信頼性にどのように影響するか?

主な発見

  • インストゥルメンタル変数法は真のネットワークと顕著な重なりを示したが、共発現法はランダムよりも優れた性能を示さなかった。
  • 媒介に基づく手法は、サンプルサイズが大きくなると、増加する残差相関が有意になるため、性能が飽和した。
  • インストゥルメンタル変数法は、特に転写のホットスポット領域で、eQTL の道具と関連するゲノム連鎖により偽陽性を生じた。
  • STB5 を中心とするホットスポットでは、IV 法は STB5 の標的を正しく予測したが、媒介法は Stb5p が自身の発現を自己調節するため失敗した。
  • 媒介法は、染色体XIIのホットスポットにおいて、IV 法が他の近傍遺伝子と区別できない中で、DNM1 を新たな候補遺伝子として同定した。
  • 本研究は、両手法が補完的役割を果たしており、IV 法は高い感度を示し、媒介法は連鎖の解消と新たなターゲットの同定を可能にすると結論づけた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。