QUICK REVIEW

[論文レビュー] A Variational Information Bottleneck Approach to Multi-Omics Data Integration

Changhee Lee, Mihaela van der Schaar|arXiv (Cornell University)|Feb 5, 2021

Bioinformatics and Genomic Networks参考文献 11被引用数 30

ひとこと要約

DeepIMV は欠損したマルチオミクス視点を柔軟に統合するために product-of-experts を用いた変分情報ボトルネックを使用し、監督付き予測で最先端のベンチマークを上回る。

ABSTRACT

Integration of data from multiple omics techniques is becoming increasingly important in biomedical research. Due to non-uniformity and technical limitations in omics platforms, such integrative analyses on multiple omics, which we refer to as views, involve learning from incomplete observations with various view-missing patterns. This is challenging because i) complex interactions within and across observed views need to be properly addressed for optimal predictive power and ii) observations with various view-missing patterns need to be flexibly integrated. To address such challenges, we propose a deep variational information bottleneck (IB) approach for incomplete multi-view observations. Our method applies the IB framework on marginal and joint representations of the observed views to focus on intra-view and inter-view interactions that are relevant for the target. Most importantly, by modeling the joint representations as a product of marginal representations, we can efficiently learn from observed views with various view-missing patterns. Experiments on real-world datasets show that our method consistently achieves gain from data integration and outperforms state-of-the-art benchmarks.

研究の動機と目的

欠損したビューを伴う異種オミクスデータを監督付き設定で統合する動機付け。
対象予測のためのビュー内およびビュー間の相互作用を利用する統一フレームワークを開発する。
すべてのビューをイン imputing せず、任意のビュー欠損パターンに柔軟に対応可能にする。
情報ボトルネックを介してタスク関連表現を学習し予測力を向上させる。

提案手法

4-netワークス DeepIMV アーキテクチャ: V ビュー固有エンコーダ、V ビュー固有予測子、PoE モジュール、マルチビュー予測子。
周辺表現 Z_v は各ビューごとに q_theta_v(z|x_v) を用いて学習される；結合表現 Z は周辺事後分布の PoE によって形成される: q_theta(z|X_bar) ≈ p(z) ∏_v∈V q_theta_v(z|x_v)。
タスク中心の学習は結合表現上で情報ボトルネック目的を用い、Y予測信号を最大化しつつ入力情報を圧縮: L_IB-J = -I(Y;Z) + β I(X_bar; Z)。
補助的な周辺 IB 損失 L_IB-M は、各ビューのエンコーダが視点固有の識別的でタスク関連の側面を捉えるよう促す: -I(Y_v; Z_v) + β_v I(X_v; Z_v).
訓練は結合および周辺 IB 損失の重み付き和を最適化する: L_Total = L_IB-J + α ∑_v L_IB-M。
ガウス周辺を用いた効率的な訓練は閉形式の PoE 結合事後を可能にし、エンコーダと予測子の決定論的/確率的写像を提供する。

実験結果

リサーチクエスチョン

RQ1欠損ビューを補完せずに、欠損のあるマルチビューオミクスデータを単一のフレームワークで統合できるか。
RQ2ビュー別の周辺表現をどのように組み合わせて、ビュー欠損パターン下で鋭く情報量の多い結合表現を形成できるか。
RQ3欠損したマルチビューデータにおいて、混合モデルや段階的アプローチよりも、PoE 結合事後が予測性能を改善するか。
RQ4ビュー固有の予測子と周辺 IB 損失は、結合モデルを利するタスク関連でビュー固有の情報を学習するのに役立つか。

主な発見

DeepIMV は TCGA および CCLE データセット全体で、欠損したマルチビューオミクスデータを統合する際に予測性能を一貫して向上させる。
Product-of-Experts の定式化は、結合潜在表現の構築で欠損ビューを無視することで任意の欠損ビューパターンを柔軟に扱うことを可能にし、追加の補完ステップを回避する。
ビュー固有の IB 損失と予測子を組み込むことは、エンコーダをビューに関連する情報に特化させ、PoE 結合表現の訓練を促進し、精度を向上させる。
実験を通じて、完全なビューを前提とする多視点ベンチマークや再構成重視の潜在空間を用いるもの（例：MVAE、MOFA）より DeepIMV が優れている。
アブレーション研究は、PoE と周辺 IB 損失の組み合わせが MoE ベースの変種より AUROC が良いことを示し、タスク関連でビュー固有の表現の価値を強調している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。