[论文解读] Uncertainty Quantification for Distribution-to-Distribution Flow Matching in Scientific Imaging
提出贝叶斯随机流匹配(BSFM),以量化分布对分布图像生成中的内在不确定性(aleatoric)和知识不确定性(epistemic),提升科学成像任务的可靠性(泛化)和可追溯性(OOD检测)。
Distribution-to-distribution generative models support scientific imaging tasks ranging from modeling cellular perturbation responses to translating medical images across conditions. Trustworthy generation requires both reliability (generalization across labs, devices, and experimental conditions) and accountability (detecting out-of-distribution cases where predictions may be unreliable). Uncertainty quantification (UQ) based approaches serve as promising candidates for these tasks, yet UQ for distribution-to-distribution generative models remains underexplored. We present a unified UQ framework, Bayesian Stochastic Flow Matching (BSFM), that disentangles aleatoric and epistemic uncertainty. The Stochastic Flow Matching (SFM) component augments deterministic flows with a diffusion term to improve model generalization to unseen scenarios. For UQ, we develop a scalable Bayesian approach -- MCD-Antithetic -- that combines Monte Carlo Dropout with sample-efficient antithetic sampling to produce effective anomaly scores for out-of-distribution detection. Experiments on cellular imaging (BBBC021, JUMP) and brain fMRI (Theory of Mind) across diverse scenarios show that SFM improves reliability while MCD-Antithetic enhances accountability.
研究动机与目标
- 通过将可靠性与可追溯性分离来推动可信的分布对分布生成模型在科学成像中的应用。
- 开发一个统一的UQ框架(BSFM),将不确定性分解为内在不确定性和知识不确定性两部分。
- 把流匹配扩展到带有随机性的形式,以在分布漂移下改善泛化性(SFM)。
- 提出一个可扩展的贝叶斯方法(MCD-Antithetic),实现高效的OOD检测与不确定性估计。
- 在细胞成像和fMRI数据集上证明泛化和OOD检测方面的改进。
提出的方法
- 通过引入可学习的扩散项,将确定性流匹配扩展为随机流匹配,以通过分数修正的SDE保持边际分布。
- 训练联合速度场和分数模型,以捕捉变换和数据变异性(内在不确定性)。
- 对模型参数采用贝叶斯处理,使用MC-Dropout近似后验分布(速度、分数参数)。
- 通过嵌套抽样估计总预测不确定性,并分解为内在不确定性和知识不确定性。
- 使用反向相关采样在基于SDE的采样中降低方差,提高不确定性估计的样本效率。
- 在集中后验下提供基于MAP的近似来降低计算量的内在不确定性估计。
实验结果
研究问题
- RQ1如何在分布对分布的图像生成中将不确定性分解为内在不确定性和知识不确定性?
- RQ2在科学成像任务中,随机流匹配是否能在分布漂移下提升泛化?
- RQ3用反向相关采样的可扩展贝叶斯方法是否能提供有效且高效的OOD检测信号?
- RQ4可靠性(泛化)与可追溯性(OOD检测)在细胞成像与神经影像数据中如何权衡?
- RQ5BSFM在生成质量和OOD感知方面相对于现有基线有哪些实际收益?
主要发现
- 随机流匹配(SFM)在跨细胞成像和fMRI数据集的分布漂移下提升了泛化能力。
- MCD-Antithetic在OOD检测中提供有效且样本高效的知识不确定性和内在不确定性估计。
- 反向相关采样降低了方差并解耦了知识不确定性与内在不确定性信号,提升了OOD检测的可靠性。
- 在未见扰动、强度漂移、未见细胞系和低ToM受试者等情形下,基于BSFM的方法在生成与OOD评估指标上优于基线。
- 在严重漂移下知识不确定性往往占主导,而在较温和漂移下内在不确定性支配,两者共同提供互补的OOD信号。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。