[论文解读] Cross-modality Matching and Prediction of Perturbation Responses with Labeled Gromov-Wasserstein Optimal Transport
扩展 GWOT/COOT,加入扰动标签以改善跨模态对齐,并在多模态单细胞扰动数据中预测跨模态的扰动响应。
It is now possible to conduct large scale perturbation screens with complex readout modalities, such as different molecular profiles or high content cell images. While these open the way for systematic dissection of causal cell circuits, integrated such data across screens to maximize our ability to predict circuits poses substantial computational challenges, which have not been addressed. Here, we extend two Gromov-Wasserstein Optimal Transport methods to incorporate the perturbation label for cross-modality alignment. The obtained alignment is then employed to train a predictive model that estimates cellular responses to perturbations observed with only one measurement modality. We validate our method for the tasks of cross-modality alignment and cross-modality prediction in a recent multi-modal single-cell perturbation dataset. Our approach opens the way to unified causal models of cell biology.
研究动机与目标
- 受多模态扰动筛选的启发,在不同读出(RNA、蛋白质、图像)下对细胞进行表型描述并以扰动标记标签化。
- 开发带标签的熵正则化 GWOT(EGWOT)和 COOT 的扩展,以利用扰动标签进行跨模态对齐。
- 证明带标签的 GWOT/COOT 能提高跨模态匹配和扰动响应的外推预测能力。
- 提供开源实现并在多模态扰动数据集上进行基准测试,以实现对细胞生物学的统一因果建模。
提出的方法
- 定义标签身份约束 B^l,强制 l-兼容的耦合,当且仅当 l_x_i = l_y_j 时 T_ij>0。
- 提出带标签的熵正则化 GWOT(Labeled EGWOT),使用 Sinkhorn 更新并证明 l-兼容 OT 计划的结构形式。
- 表明当成本为若干函数之和的形式时,带标签的 GWOT 成本可加速,便于大规模扰动筛选的快速计算。
- 将带标签的 COOT(及 ECOOT)改编为在标签间共享全局特征传输的同时,联合优化每个标签的样本传输。
- 利用学到的耦合 T 训练一个跨模态预测器(MLP),通过从 j ~ Multinomial(T_i· / sum T_i·) 的采样来由蛋白质测量预测 RNA。
- 在多模态扰动数据集上与无标签 OT/GWOT、DAVAE、以及每标签变体进行对比基准,以评估匹配、预测和特征匹配。
实验结果
研究问题
- RQ1扰动标签是否能提高 RNA 与蛋白质(或其他模态)在扰动筛选中的跨模态对齐?
- RQ2带标签的 GWOT/COOT 扩展是否在样本匹配与扰动响应预测的准确性方面优于无标签方法?
- RQ3将标签信息纳入能否实现跨模态对一个模态中的扰动效应对另一模态的准确外推预测?
主要发现
| 方法 | Bary FOSCTTM (↓) | 剂量匹配(↑) | 平均排名 | R_v (↑) | ρ_v (↑) | R_s (↑) | ρ_s (↑) | 均方误差(↓) | 平均排名 | 富集(↑) | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Perfect | 0 | 1 | - | 0.107 | 0.118 | 0.163 | 0.149 | 0.258 | - | 6.95 | |
| By dosage | 0.239 | 1 | - | 0.0812 | 0.0448 | 0.0903 | 0.0863 | 0.264 | - | 5.16 | |
| Uniform per label | 0.298 | 0.357 | - | 0.0794 | 0.0403 | 0.0761 | 0.0781 | 0.264 | - | 1.85 | |
| EOT | no label | 0.428 | 0.040 | 9 | 0.0482 | 0.007 | 0.0068 | 0.0063 | 0.287 | 7 | 1.10 |
| per label | 0.336 | 0.346 | 5 | 0.0544 | 0.0239 | 0.0345 | 0.0307 | 0.283 | 5.2 | 1.26 | |
| ECOOT | no label | 0.414 | 0.049 | 8 | 0.053 | 0.0207 | 0.0395 | 0.0408 | 0.282 | 5 | 1.07 |
| per label | 0.332 | 0.381 | 4 | 0.0785 | 0.0449 | 0.0737 | 0.0737 | 0.265 | 2.6 | 1.26 | |
| labeled | 0.270 | 0.456 | 2 | 0.0852 | 0.0523 | 0.0854 | 0.0778 | 0.265 | 1.6 | 5.31 | |
| EGWOT | no label | 0.373 | 0.068 | 7 | 0.0631 | 0.0227 | 0.0302 | 0.034 | 0.282 | 4.8 | 3.74 |
| per label | 0.283 | 0.452 | 3 | 0.0836 | 0.044 | 0.0854 | 0.0825 | 0.264 | 1.8 | 19.8 | |
| labeled | 0.332 | 0.381 | 4 | 0.0785 | 0.0449 | 0.0737 | 0.0737 | 0.265 | 2.6 | 1.26 | |
| DAVAE | no label | 0.231 | 0.206 | 3 | 0.0342 | -0.0069 | 0.0006 | -0.0001 | 0.33 | 8 | - |
| labeled | 0.242 | 0.205 | 4 | 0.0182 | -0.0079 | -0.0016 | -0.0014 | 0.332 | 9 | - |
- 带标签的 GWOT 基方法(EGWOT 和 ECOOT)在匹配与预测方面优于无标签 OT/GWOT 基线。
- 整合扰动标签能在扰动之间共享信息,提升全局拓扑学习与样本耦合。
- 按标签的 GWOT 变体优于无标签方法,但被完全带标签的方法超越,因为跨标签信息共享。
- 与 DAVAE 基线相比,带标签的 GWOT 方法在匹配和预测方面表现更好,而 DAVAE 的预测性能较弱。
- 该框架在样本匹配、预测和特征匹配方面表现出色,提示跨模态特征可解释性提升。
- 代码和数据已开放获取(Genentech/Perturb-OT),用于可重复的基准测试。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。