[论文解读] Predicting Cellular Responses to Novel Drug Perturbations at a Single-Cell Resolution
ChemCPA 是一个编码器-解码器模型,通过结合药物分子结构和从大规模RNA HTS数据的迁移学习,预测未见药物的单细胞基因表达反应,能够在单细胞分辨率下进行反事实扰動预测。
Single-cell transcriptomics enabled the study of cellular heterogeneity in response to perturbations at the resolution of individual cells. However, scaling high-throughput screens (HTSs) to measure cellular responses for many drugs remains a challenge due to technical limitations and, more importantly, the cost of such multiplexed experiments. Thus, transferring information from routinely performed bulk RNA HTS is required to enrich single-cell data meaningfully. We introduce chemCPA, a new encoder-decoder architecture to study the perturbational effects of unseen drugs. We combine the model with an architecture surgery for transfer learning and demonstrate how training on existing bulk RNA HTS datasets can improve generalisation performance. Better generalisation reduces the need for extensive and costly screens at single-cell resolution. We envision that our proposed method will facilitate more efficient experiment designs through its ability to generate in-silico hypotheses, ultimately accelerating drug discovery.
研究动机与目标
- 由于单细胞RNA测序筛选能力有限,需要动机预测未见药物在单细胞分辨率下的扰动反应。
- 开发一个利用药物结构将扰动推广到未见化合物的模型。
- 通过迁移学习利用大规模 bulk RNA HTS 数据以提升单细胞层面的泛化能力。
- 提供一个可解释的潜变量空间,解耦基础状态、药物和协变量分量。
提出的方法
- 引入 chemCPA,这是一种带对抗性解耦的编码器-解码器架构。
- 使用一个加性潜在空间,其中 z_i 通过 z_c(细胞系)和 hat{s} z_d(药物及剂量)进行增强。
- 使用扰动网络 G、M、S 将分子表示映射到潜在扰动。
- 冻结一个预训练的分子编码器 G(RDKit 特征),训练 M 和 S 以产生药物扰动 z_d 和缩放剂量 hat{s}。
- 使用对抗分类器进行训练,通过带梯度惩罚的损失将基础状态 z_i 与药物和协变量信息解耦。
实验结果
研究问题
- RQ1ChemCPA 是否能够通过利用药物结构,在训练期间未见的药物上预测扰动反应?
- RQ2即使基因集不同,来自 bulk RNA HTS(L1000)的迁移学习是否能提高单细胞的泛化能力?
- RQ3潜在空间的解耦是否能实现对药物效应与细胞系效应的可解释归因?
- RQ4在剂量、细胞系和未见化合物的反事实预测中,chemCPA 的表现如何?
主要发现
- ChemCPA 在单细胞数据中对未见药物-协变量组合的泛化 performances 超越 CPA 和 scGen。
- 在 bulk L1000 数据上的预训练使 chemCPA 获得最佳表现,在全基因和 DEG 相关的 r2 得分上均有显著提升。
- 在扩展基因集条件下,预训练的 chemCPA 仍然稳健,且常常超过基线;未预训练的 chemCPA 可能表现不佳。
- 该模型为未见药物提供不确定性度量,与泛化能力相关。
- 潜在扰动嵌入按 MoA 聚类,表明药物表示中存在有意义的生物学结构。
- 与之前需要已见药物的 CPA 不同,该方法通过扰动网络实现对未见化合物的预测。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。