QUICK REVIEW

[论文解读] Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

Maximilian Alber, Stephan Tietz|arXiv (Cornell University)|Jan 9, 2025

Tuberculosis Research and Epidemiology被引用 3

一句话总结

Atlas 是一个基于 Mayo Clinic 与 Charité 的120万张数字病理切片自监督学习训练的病理基础模型，在21项公开病理基准上实现了总体最优性能，但并非参数量或数据量最大的模型。

ABSTRACT

Recent advances in digital pathology have demonstrated the effectiveness of foundation models across diverse applications. In this report, we present Atlas, a novel vision foundation model based on the RudolfV approach. Our model was trained on a dataset comprising 1.2 million histopathology whole slide images, collected from two medical institutions: Mayo Clinic and Charité - Universtätsmedizin Berlin. Comprehensive evaluations show that Atlas achieves state-of-the-art performance across twenty-one public benchmark datasets, even though it is neither the largest model by parameter count nor by training dataset size.

研究动机与目标

通过大规模自监督学习，推动病理组学中鲁棒、可推广的表征学习。
利用多染色、多放大倍数的 WSIs，覆盖不同组织类型与扫描仪变异。
在广泛的下游病理任务中评估 Atlas 以考察其泛化能力。
将 Atlas 与其他领先的病理基础模型进行对比，定位其优势与局限性。

提出的方法

使用改进的 RudolfV 自监督方法，基于 DINOv2 框架训练一个 ViT-H/14 病理基础模型（632M 参数）。
使用来自 Mayo Clinic 与 Charité 的120万张去标识化 WSIs 数据集，切片在多分辨率（0.25、0.5、1.0、2.0 μm/像素）下生成。
为训练抽样约5.2亿张切片；在 Mayo Clinic Platform 内使用 Nvidia H100 GPU 进行训练。
通过线性探针和 ABMIL 风格的切片级方法在21项公开基准上评估嵌入，使用 CLS 与 CLS+Mean token 表示。
以Patch-level任务的平衡准确度和基于 ABMIL 的切片级任务评估性能；报告不同随机种子下的均值与标准误。

实验结果

研究问题

RQ1Atlas 与现有基础模型相比，在形态学与分子相关的病理任务上表现如何？
RQ2多染色、多放大培训是否在不同数据集和扫描仪上带来鲁棒性与泛化优势？
RQ3所选 token 表示（CLS vs CLS+Mean）对下游性能有何影响？
RQ4在不以参数或数据量为最大前提下，Atlas 是否能实现最先进的结果？

主要发现

Group	Benchmark	Phikon v2	UNI	Gigapath	RudolfV	Virchow2	H-optimus-0	Atlas
Molecular-related	HEST-COAD	25.6	26.2	30.7	31.0	25.9	30.9	29.4
HEST-HCC	7.8	8.3	7.1	9.4	9.6	8.4	10.7
HEST-IDC	56.6	58.5	56.8	57.4	59.3	61.0	60.4
HEST-LUAD	54.8	55.2	55.8	57.7	56.9	57.3	58.0
HEST-LYMPH_IDC	24.8	25.8	25.1	25.6	25.9	26.8	26.4
HEST-PAAD	47.9	48.8	49.5	51.1	47.3	50.9	51.8
HEST-PRAD	37.7	32.2	38.4	37.7	35.1	38.5	38.4
HEST-READ	18.5	18.4	19.6	19.9	21.1	24.1	22.8
HEST-SKCM	58.4	63.5	58.8	61.8	63.7	66.1	62.5
HEST-ccRCC	27.3	25.3	24.9	25.3	27.4	29.0	29.4
MSI CRC (patch)	68.8	69.5	70.4	69.9	74.0	71.2	73.6
MSI STAD (patch)	71.2	70.5	71.0	74.1	74.8	73.6	76.0
Pan-cancer TIL	92.9	92.6	92.3	92.6	93.1	93.0	93.0
TCGA Uniform (10x)	64.0	68.6	69.1	70.6	73.0	70.4	71.8
TCGA Uniform (20x)	69.8	67.8	68.0	78.1	71.5	72.4	67.8
BACH	73.8	80.1	80.2	76.9	88.7	75.8	93.1
CRC-100k	95.5	95.4	95.9	96.0	96.7	96.2	97.1
MHIST	78.4	84.4	83.1	80.5	85.9	85.0	86.4
PCAM	90.0	93.6	94.5	94.6	93.9	94.3	94.9
CAMELYON16	79.8	85.0	82.1	77.1	86.5	84.0	86.8
PANDA	65.3	69.6	69.6	69.6	66.4	68.0	70.5
Morphology-average
-	-	-	-	-	-	-

Atlas 在21项基准上的平均表现为61.9%，平均领先 Virchow2 与 H-Optimus-0 1.1个百分点。
Atlas 在21项基准中有11项在分子-形态相关任务上表现最佳，在其他任务上多处处于第二名。
在分子相关任务中，Atlas 在若干 HEST 任务上排名第一，整体化合物表现亦名列前茂，且在多项基准中实现前二名。
在形态相关基准中，Atlas 在 MSI CRC、MSI STAD、TCGA Uniform、BACH、CRC-100k、MHIST、PCAM、CAMELYON16、PANDA 等多个数据集上实现顶尖表现。
尽管 Atlas 不是参数量或数据量最大的模型，其表现仍接近或超越最先进模型，显示其对多样化训练数据的强泛化能力。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。