Skip to main content
QUICK REVIEW

[论文解读] MAGAN: Aligning Biological Manifolds

Matthew Amodio, Smita Krishnaswamy|arXiv (Cornell University)|Feb 10, 2018
Single-cell and spatial transcriptomics参考文献 19被引用 29
一句话总结

MAGAN 提出了一种新型生成对抗网络,通过强制执行点对点对应关系而非任意叠加,实现了对未配对多组学生物数据(如单细胞 RNA 测序和质谱流式细胞术)的流形对齐。与基线模型相比,其在对应关系预测上的均方误差(MSE)降低了 78%,显著提升了单细胞数据整合的对齐精度。

ABSTRACT

It is increasingly common in many types of natural and physical systems (especially biological systems) to have different types of measurements performed on the same underlying system. In such settings, it is important to align the manifolds arising from each measurement in order to integrate such data and gain an improved picture of the system. We tackle this problem using generative adversarial networks (GANs). Recently, GANs have been utilized to try to find correspondences between sets of samples. However, these GANs are not explicitly designed for proper alignment of manifolds. We present a new GAN called the Manifold-Aligning GAN (MAGAN) that aligns two manifolds such that related points in each measurement space are aligned together. We demonstrate applications of MAGAN in single-cell biology in integrating two different measurement types together. In our demonstrated examples, cells from the same tissue are measured with both genomic (single-cell RNA-sequencing) and proteomic (mass cytometry) technologies. We show that the MAGAN successfully aligns them such that known correlations between measured markers are improved compared to other recently proposed models.

研究动机与目标

  • 为解决来自不同检测技术(如单细胞 RNA 测序和 CyTOF)的未配对多组学单细胞数据整合挑战。
  • 开发一种在不同模态间保留细胞点对点对应关系的方法,而非允许任意流形叠加。
  • 在已知细胞身份稀疏或获取成本高昂的生物系统中,提升跨模态细胞映射的准确性。
  • 通过最小化监督整合互补数据类型,实现更可靠的生物发现。

提出的方法

  • MAGAN 采用条件 GAN 架构,包含两个生成器和两个判别器,实现两个域(如单细胞 RNA 测序和 CyTOF)之间的双向映射。
  • 引入对应损失,惩罚源样本与其跨域转换后重建样本之间的差异。
  • 模型使用重建损失以在翻译过程中保持身份一致性,并使用循环一致性损失以稳定训练。
  • 通过仅使用 10 个已知配对细胞,应用半监督对应损失,显著提升对齐精度。
  • 该方法通过对抗损失、对应损失和重建损失端到端训练,优化生成一致且具有生物意义的映射。
  • 将高维单细胞数据嵌入低维流形,再通过 GAN 框架实现流形对齐。

实验结果

研究问题

  • RQ1基于 GAN 的模型能否在来自不同测量模态的未配对生物数据之间学习到有意义且一致的对应关系?
  • RQ2与仅通过流形叠加的普通 GAN 相比,强制执行对应损失是否能提升对齐精度?
  • RQ3少量已知细胞对(例如 10 对)在多大程度上能提升无监督流形对齐的性能?
  • RQ4MAGAN 是否能在最小监督条件下,优于现有最先进模型,实现单细胞 RNA 测序与质谱流式细胞术数据的映射?

主要发现

  • 在从 CyTOF 映射到单细胞 RNA 测序时,MAGAN 将对应关系预测的均方误差(MSE)从 99.3 降低至 22.0,实现了 78% 的改进。
  • 在反向映射(单细胞 RNA 测序到 CyTOF)中,MSE 从 33.7 降低至 7.1,误差减少了 79%。
  • 即使仅使用 10 对标注细胞对,半监督对应损失也显著提升了对齐精度,证明了其低监督效率。
  • 该模型成功保留了标记物之间的生物学关系,改善了蛋白质与基因表达水平之间已知的相关性。
  • MAGAN 通过强制执行流形对齐而非任意流形叠加,优于现有基于 GAN 的模型。
  • 该方法能够实现高维、低覆盖度组学数据的精确整合,促进细胞类型特异性调控关系的发现。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。