Skip to main content
QUICK REVIEW

[論文レビュー] Cross-modality Matching and Prediction of Perturbation Responses with Labeled Gromov-Wasserstein Optimal Transport

Jayoung Ryu, Charlotte Bunne|arXiv (Cornell University)|May 1, 2024
Plant Surface Properties and Treatments被引用数 6
ひとこと要約

要約: perturbationラベルを用いてGWOT/COOTを拡張し、クロ modality の整合性を改善し、多模組みショットの単一細胞 Perturbation データにおける perturbation 応答の予測を可能にする。

ABSTRACT

It is now possible to conduct large scale perturbation screens with complex readout modalities, such as different molecular profiles or high content cell images. While these open the way for systematic dissection of causal cell circuits, integrated such data across screens to maximize our ability to predict circuits poses substantial computational challenges, which have not been addressed. Here, we extend two Gromov-Wasserstein Optimal Transport methods to incorporate the perturbation label for cross-modality alignment. The obtained alignment is then employed to train a predictive model that estimates cellular responses to perturbations observed with only one measurement modality. We validate our method for the tasks of cross-modality alignment and cross-modality prediction in a recent multi-modal single-cell perturbation dataset. Our approach opens the way to unified causal models of cell biology.

研究の動機と目的

  • RNA、タンパク質、画像など異なるリードアウトでプロファイルされ、 perturbation でラベル付けされた多模態 perturbation スクリーンに動機付けられる。
  • ラベル付きのエントロピー正則化 GWOT (EGWOT) および COOT の拡張を提案し、クロ modality 整合性に perturbation ラベルを活用する。
  • ラベル情報を組み込んだ GWOT/COOT がクロ modality のマッチングを改善し、 perturbation 応答のサンプル外予測を可能にすることを示す。
  • 統一的な因果モデリングを可能にする多模態 perturbation データセットに対するオープンソース実装とベンチマークを提供する。

提案手法

  • l_i ラベル互換結合を強制する B^l を定義し、T_ij > 0 となるのは l_x_i = l_y_j のときのみとする。
  • Sinkhorn ベースの更新を用いたラベル付きエントロピー正規化 GWOT (Labeled EGWOT) を提案し、l-互換 OT 計画の構造的形を証明する。
  • コストが関数の和の形をとる場合、ラベル付き GWOT のコストを加速できることを示し、大規模 perturbation スクリーンに対する計算効率を改善する。
  • ラベル付き COOT を適応し、ラベル間で共有されるグローバル特徴輸送とともに、各ラベルごとのサンプル輸送を共同で最適化する。
  • 学習した結合 T を用いて、RNA をタンパク質測定から予測するクロ modality 予測器(MLP)を訓練し、j ~ Multinomial(T_i· / sum T_i·) をサンプリングして予測する。
  • マルチモーダル perturbation データセット上で、ラベルなし OT/GWOT、DAVAE、ラベルごとの変種と比較して、マッチング、予測、特徴マッチングを評価する。

実験結果

リサーチクエスチョン

  • RQ1perturbation ラベルは perturbation スクリーンにおいて RNA とタンパク質(または他のモダリティ間)のクロ modality 整合性を改善できるか。
  • RQ2ラベル付き GWOT/COOT の拡張は、ラベルなしの手法と比較してサンプルマッチングと perturbation 応答の予測精度を改善するか。
  • RQ3ラベル情報を組み込むことで、別のモダリティの観測から別のモダリティの perturbation 効果を正確にアウト・オブ・サンプル予測できるか。

主な発見

方法Bary FOSCTTM (↓)用量一致度(↑)平均順位R_v (↑)ρ_v (↑)R_s (↑)ρ_s (↑)MSE (↓)平均順位富化(↑)
Perfect01-0.1070.1180.1630.1490.258-6.95
By dosage0.2391-0.08120.04480.09030.08630.264-5.16
Uniform per label0.2980.357-0.07940.04030.07610.07810.264-1.85
EOTno label0.4280.04090.04820.0070.00680.00630.28771.10
per label0.3360.34650.05440.02390.03450.03070.2835.21.26
ECOOTno label0.4140.04980.0530.02070.03950.04080.28251.07
per label0.3320.38140.07850.04490.07370.07370.2652.61.26
labeled0.2700.45620.08520.05230.08540.07780.2651.65.31
EGWOTno label0.3730.06870.06310.02270.03020.0340.2824.83.74
per label0.2830.45230.08360.0440.08540.08250.2641.819.8
labeled0.3320.38140.07850.04490.07370.07370.2652.61.26
DAVAEno label0.2310.20630.0342-0.00690.0006-0.00010.338-
labeled0.2420.20540.0182-0.0079-0.0016-0.00140.3329-
  • ラベル付き GWOT ベースの手法(EGWOT および ECOOT)は、マッチングと予測の面でラベルなし OT/GWOT のベースラインを上回る。
  • perturbation ラベルの組み込みにより、perturbation 間で情報を共有でき、全体的なトポロジー学習とサンプル結合を改善する。
  • ラベルごとの GWOT 変種はラベルなしのアプローチより改善するが、ラベル間情報共有の効果により完全にラベル付きアプローチには及ばない。
  • DAVAE のベースラインと比較して、ラベル付き GWOT 手法はマッチングと予測でより良い結果を達成し、DAVAE は予測性能が劣る。
  • 本フレームワークはサンプルマッチング、予測、特徴マッチングの総合的な性能を向上させ、クロ modality の特徴の解釈性の向上を示唆する。
  • コードとデータは再現可能なベンチマークのため Genentech/Perturb-OT として公開される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。