Skip to main content
QUICK REVIEW

[論文レビュー] INFERRING GENE ASSOCIATION NETWORKS USING SPARSE CANONICAL CORRELATION ANALYSIS

Y. X. Rachel Wang, Keni Jiang|arXiv (Cornell University)|Jan 25, 2014
Bioinformatics and Genomic Networks参考文献 6被引用数 6
ひとこと要約

本論文は、スパースな正準相関分析(SCCA)を用いた新規手法を提案する。この手法は、条件付き依存関係を推定するために繰り返しランダムな分割とサブサンプリングを組み合わせ、遺伝子群間の条件付き依存関係を推定する。異なる順序の偏相関を統合することで、統計的有意性と生物学的解釈可能性が向上し、既存の手法と比較して誤検出率が低く、重要な生物学的経路の検出能が向上する。

ABSTRACT

Networks pervade many disciplines of science for analyzing complex systems with interacting components. In particular, this concept is commonly used to model interactions between genes and identify closely associated genes forming functional modules. In this paper, we focus on gene group interactions and infer these interactions using appropriate partial correlations between genes, that is, the conditional dependencies between genes after removing the influences of a set of other functionally related genes. We introduce a new method for estimating group interactions using sparse canonical correlation analysis (SCCA) coupled with repeated random partition and subsampling of the gene expression data set. By considering different subsets of genes and ways of grouping them, our interaction measure can be viewed as an aggregated estimate of partial correlations of different orders. Our approach is unique in evaluating conditional dependencies when the correct dependent sets are unknown or only partially known. As a result, a gene network can be constructed using the interaction measures as edge weights and gene functional groups can be inferred as tightly connected communities from the network. Comparisons with several popular approaches using simulated and real data show our procedure improves both the statistical significance and biological interpretability of the results. In addition to achieving considerably lower false positive rates, our procedure shows better performance in detecting important biological pathways.

研究の動機と目的

  • 条件付き依存関係にある遺伝子の正しい集合が不明または部分的にしか不明でない状況において、遺伝子関連ネットワークを推定する課題に対処すること。
  • 高次偏相関をモデル化することで、遺伝子ネットワーク構築の統計的パワーと生物学的解釈可能性を向上させること。
  • 遺伝子相互作用の検出における誤検出率を低減するとともに、機能的に関連する遺伝子モジュールの同定を強化すること。
  • 事前に正しい条件付け集合を知らなくてもよい、堅牢でデータ駆動型のアプローチを開発すること。このアプローチは、複数のランダムな分割とサブサンプルの間で相互作用推定値を統合する。

提案手法

  • 本手法は、他の機能的に関連する遺伝子を調整した上で、遺伝子群間の条件付き依存関係を捉えるために、スパースな正準相関分析(SCCA)を用いて正準相関を推定する。
  • 遺伝子発現データの繰り返しランダムな分割とサブサンプリングを用いて、多様なグループ化を生成し、異なる順序の偏相関を推定可能にする。
  • SCCAから得られる相互作用指標を複数のサブサンプルにわたって統合することで、安定的かつ頑健な遺伝子群間関連性の推定値を得る。
  • 統合された相互作用スコアは、遺伝子ネットワークにおけるエッジ重みとして機能し、密に接続されたコミュニティとして機能的遺伝子モジュールが同定される。
  • 本手法は、正しい条件付け集合の事前知識を必要としないため、生物学的文脈が不完全または不確実な状況にも適している。
  • 標準的なコミュニティ検出アルゴリズムを用いて、構築されたネットワーク内の密に接続されたコミュニティとして遺伝子機能群が同定される。

実験結果

リサーチクエスチョン

  • RQ1条件付き依存関係にある遺伝子の正しい集合が不明または部分的にしか不明でない状況において、どのように遺伝子関連ネットワークを構築できるか?
  • RQ2複数のランダムなグループ化において偏相関推定値を統合することで、遺伝子ネットワーク推定の正確性と安定性はどの程度向上するか?
  • RQ3提案されたSCCAベースの手法は、誤検出率を低く抑えつつ、生物学的に関連する経路を既存の手法よりも効果的に検出できるか?
  • RQ4本手法は、シミュレートされたデータおよび実際の遺伝子発現データの両方において、機能的モジュールをどの程度うまく同定できるか?

主な発見

  • 提案手法は、シミュレート済みおよび実データの両方の実験において、複数の一般的なネットワーク推定手法と比較して顕著に低い誤検出率を達成した。
  • 本手法は、重要な生物学的経路の検出において優れた性能を示し、推定されたネットワークの生物学的解釈可能性が向上した。
  • 複数のランダムな分割とサブサンプルにおける相互作用推定値の統合は、より安定的かつ信頼性の高いネットワーク構造をもたらした。
  • SCCAの使用により、高次偏相関の効果的な推定が可能となり、遺伝子群間の複雑な条件付き依存関係を捉えることができた。
  • 機能的遺伝子モジュールは、推定されたネットワーク内での密に接続されたコミュニティとして成功裏に同定され、既知の生物学的経路と整合した。
  • 本手法は、条件付け集合の選択に関する不確実性に対しても頑健であるため、生物学的知識が不完全な現実世界の状況にも適用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。