Skip to main content
QUICK REVIEW

[論文レビュー] Predicting Cellular Responses to Novel Drug Perturbations at a Single-Cell Resolution

Leon Hetzel, Simon Böhm|arXiv (Cornell University)|Apr 28, 2022
Single-cell and spatial transcriptomics被引用数 42
ひとこと要約

ChemCPAは、薬物分子構造の組み込みと bulk RNA HTSデータからの転移学習を取り入れることで、未見の薬剤に対する単一細胞遺伝子発現応答を予測するエンコーダ-デコーダモデルであり、単一細胞解像度で反事実摂動予測を可能にします。

ABSTRACT

Single-cell transcriptomics enabled the study of cellular heterogeneity in response to perturbations at the resolution of individual cells. However, scaling high-throughput screens (HTSs) to measure cellular responses for many drugs remains a challenge due to technical limitations and, more importantly, the cost of such multiplexed experiments. Thus, transferring information from routinely performed bulk RNA HTS is required to enrich single-cell data meaningfully. We introduce chemCPA, a new encoder-decoder architecture to study the perturbational effects of unseen drugs. We combine the model with an architecture surgery for transfer learning and demonstrate how training on existing bulk RNA HTS datasets can improve generalisation performance. Better generalisation reduces the need for extensive and costly screens at single-cell resolution. We envision that our proposed method will facilitate more efficient experiment designs through its ability to generate in-silico hypotheses, ultimately accelerating drug discovery.

研究の動機と目的

  • 未見の薬剤に対する摂動応答を単一細胞解像度で予測する必要性を、制限されたscRNA-seqスクリーニング能力のため動機づける。
  • 薬物構造を用いて未見化合物への摂動を一般化するモデルを開発する。
  • 転移学習を通じて bulk RNA HTSデータを活用し、単一細胞の一般化を改善する。
  • 基底、薬物、共変量の要素を解 disentangleした解釈可能な潜在空間を提供する。

提案手法

  • 敵対的な分離を用いたエンコーダ-デコーダアーキテクチャとしてchemCPAを導入する。
  • z_iを、z_c(細胞系)とhat{s} z_d(薬物と用量)で加算的潜在空間として拡張する。
  • 分子表現を潜在摂動へ写像する摂動ネットワーク G, M, S を用いる。
  • 事前学習済み分子エンコーダ G(RDKit特徴量)を凍結し、MとSを訓練して薬物摂動 z_d とスケールド用量 hat{s} を生成する。
  • 勾配ペナルティ付き損失を用いた敵対的分類器で基底状態 z_i を薬物情報および共変量情報から分離するよう訓練する。

実験結果

リサーチクエスチョン

  • RQ1chemCPAは訓練中に見なかった薬物の構造を活用して摂動応答を予測できるか。
  • RQ2bulk RNA HTS(L1000)からの転移学習は、異なる遺伝子セットを用いても単一細胞の一般化を改善するか。
  • RQ3潜在空間の分離は薬物と細胞系の影響の解釈可能な帰属を可能にするか。
  • RQ4薬物を未見化合物として扱う場合の摺動、細胞系、見なしの化合物に対する反事実予測の性能はどの程度か。

主な発見

  • ChemCPAは、 unseen drug-covariate combinations に対する単一細胞データの一般化でCPAおよびscGenを上回る。
  • bulk L1000データで chemCPAを事前訓練すると最良の性能を示し、全遺伝子およびDEG焦点の r2 スコアで大幅な向上が見られる。
  • 拡張遺伝子セットであっても、事前訓練済み chemCPA は堅牢でベースラインを超えることが多いが、非事前訓練の chemCPA は劣る場合がある。
  • 見なし薬に対する不確実性計測を提供し、それが一般化能力と相関する。
  • 潜在摂動埋め込みは MoA でクラスタリングされ、薬物表現の生物学的構造化が意味を持つことを示す。
  • このアプローチは、摂動ネットワークを通じて unseen 化合物の予測を可能にし、従来の CPA が見た薬物を必要とする点を超える。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。