[论文解读] Towards Universal Spatial Transcriptomics Super-Resolution: A Generalist Physically Consistent Flow Matching Framework
SRast 是一个通用的空间转录组学超分辨率框架,将基因语义与几何解耦,并使用物理约束的流匹配实现跨物种、组织与平台的零-shot泛化,且质量守恒。
Spatial transcriptomics provides an unprecedented perspective for deciphering tissue spatial heterogeneity. However, high-resolution spatial transcriptomic technology remains constrained by limited gene coverage, technical complexity, and high cost. Existing spatial transcriptomics super-resolution methods from low resolution data suffer from two fundamental limitations: poor out-of-distribution generalization stemming from a neglect of inherent biological heterogeneity, and a lack of physical consistency. To address these challenges, we propose SRast, a novel physically constrained generalist framework designed for robust spatial transcriptomics super-resolution. To tackle heterogeneity, SRast employs a strategic decoupling architecture that explicitly decouples gene semantics representation from spatial geometry deconvolution, utilizing self-supervised learning to align latent distributions and mitigate cross-sample shifts. Regarding physical priors, SRast reformulates the task as ratio prediction on the simplex, performing a flow matching model to learn optimal transport-based geometric transformations that strictly enforce local mass conservation. Extensive experiments across diverse species, tissues, and platforms demonstrate that SRast achieves state-of-the-art performance, exhibiting superior zero-shot generalization capabilities and ensuring physical consistency in recovering fine-grained biological structures.
研究动机与目标
- 解决高分辨率 ST 在基因覆盖有限、异质性强、成本高等挑战
- 实现跨物种、组织与平台的鲁棒零-shot泛化
- 在 SR 重建过程中保持局部质量守恒以实现物理一致性
- 将基因语义与空间去卷积解耦,以缓解对样本特定模式的过拟合
提出的方法
- 引入结构感知语义对齐(SASA),通过双拓扑图与 GraphVAE 学习分布对齐的基因表示
- 应用 LatentNorm 对齐批次间潜在分布,缓解跨样本漂移
- 将物理约束的流匹配(PCFM)作为在单纯形上的比率预测,以学习通用的最优传输流
- 使用平滑中心化对数变换(S-CLT)稳定稀疏单纯形分配下的学习
- 引入基于扩散 Transformer 的速度模型,结合 AdaLN 条件化与边界一致性正则化,尊重单纯形几何
- 通过解初值问题来推断 SR,将学习到的流整合以映射噪声到高分辨基因分配比,然后投影到单纯形并按 LR 质量缩放
实验结果
研究问题
- RQ1SRast 能否在空间转录组学超分辨中实现对未见物种、组织与平台的零-shot泛化?
- RQ2将基因语义与空间几何解耦是否提高对生物异质性和 OOD 移位的鲁棒性?
- RQ3将 SR 重新表述为对单纯形上的比率预测并结合流匹配,是否强制执行质量守恒并减少生物幻觉?
主要发现
- SRast 在跨物种的零-shot 泛化中在多个数据集与分辨率(如 4x 与 10x 放大)上达到最先进水平。
- SRast 展示出极高的物理一致性,局部质量守恒误差极小(示例误差约为 4.0e-8)。
- SASA 通过学习分布对齐的语义表示有效缓解跨样本分布移位;LatentNorm 降低批次相关差异。
- PCFM 在单纯形上学习通用传输流,保持质量同时实现跨基因与点的高分辨分配。
- 在跨数据集与跨平台评估中,SRast 在 SR 重建质量指标(如基因表达的 Spearman、PCC)和聚类为基础的 ARI 等方面超过传统插值和先前的 STSR 方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。