[論文レビュー] Integrate Any Omics: Towards genome-wide data integration for patient stratification
IntegrAOは、不完全なマルチオミクスプロファイルを部分的に重なる患者グラフとグラフニューラルネットワークを用いて統合する監督なしフレームワークであり、患者を細分化し、部分データを用いた新規サンプルの正確な分類を可能にします。
High-throughput omics profiling advancements have greatly enhanced cancer patient stratification. However, incomplete data in multi-omics integration presents a significant challenge, as traditional methods like sample exclusion or imputation often compromise biological diversity and dependencies. Furthermore, the critical task of accurately classifying new patients with partial omics data into existing subtypes is commonly overlooked. To address these issues, we introduce IntegrAO (Integrate Any Omics), an unsupervised framework for integrating incomplete multi-omics data and classifying new samples. IntegrAO first combines partially overlapping patient graphs from diverse omics sources and utilizes graph neural networks to produce unified patient embeddings. Our systematic evaluation across five cancer cohorts involving six omics modalities demonstrates IntegrAO's robustness to missing data and its accuracy in classifying new samples with partial profiles. An acute myeloid leukemia case study further validates its capability to uncover biological and clinical heterogeneity in incomplete datasets. IntegrAO's ability to handle heterogeneous and incomplete data makes it an essential tool for precision oncology, offering a holistic approach to patient characterization.
研究の動機と目的
- サンプルを捨てたり値を補完したりせず、欠損したマルチオミクスデータに対処する。
- 部分的にオーバーラップするオミクスグラフを統合して統一された患者埋め込みに融合する、教師なしフレームワークを開発する。
- 部分的なオミクスデータを持つ新規患者を、あらかじめ定義されたサブタイプへ正確に分類できるようにする。
- 複数の癌コホートとオミクスモダリティにまたがるロバスト性を示す。
- ケーススタディや生存/薬物反応分析を通じて生物学的・臨床的関連性を検証する。
提案手法
- ノードを患者、エッジをペアワイズ類似性とする各オミクスごとの患者グラフを構築する。
- 部分的に重なるグラフを反復的に融合して、融合済みのオミクス固有グラフを作成する。
- オミクス固有のグラフニューラルネットワークエンコーダを用いて、低次元の患者埋め込みを学習する。
- オミクス間の埋め込みを共有空間で整列させ、平均して統合埋め込みを得る。
- 新規患者の監視下サブタイプ予測を可能にするために、オプションでMLPヘッドでファインチューニングする。
- シミュレーション(部分的なオーバーラップ)と実際の癌コホート(AMLを含む)を対象に、6つのオミクスモダリティを横断して評価する。
実験結果
リサーチクエスチョン
- RQ1IntegrAOはサンプルを捨てることなく、部分的にオーバーラップするマルチオミクスデータを頑健に統合できるか?
- RQ2欠損オミクスプロファイルを持つ新規患者を事前定義されたサブタイプへどの程度正確に分類できるか?
- RQ3統合サブタイプは、単一オミクス分析を超えて臨床的にも生物学的にも意味のある異質性を明らかにするか?
- RQ4IntegrAOは複数の癌タイプとオミクスモダリティに対してスケーラブルで効果的か?
- RQ5欠損データパターンがクラスタリング品質や生存/薬物応答の関連に与える影響は何か?
主な発見
- IntegrAOは、シミュレーションされた部分的オーバーラップシナリオでNEMOおよびMSNEを上回る。
- IntegrAOは、mRNA、DNAメチレーション、細胞階層データを統合することにより、12の生物学的・臨床的に異なるAMLサブタイプを同定する。
- 統合サブタイプは、単一データ型と比較して生存差の分化と臨床的エンリッチメントを改善している。
- 部分データを有する5つのTCGAがんタイプにおいて、IntegrAOは競合よりも差のある生存と臨床エンリッチメントをより信頼性高く達成する。
- 新規患者の分類において、IntegrAOはMLP、SVM、XGBoost、Random Forest、KNNを、さまざまなオミクスの組み合わせで上回る。
- IntegrAOはモダリティに依存しない推論を可能にし、欠損データでも高い性能を維持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。