[论文解读] MoCo-CXR: MoCo Pretraining Improves Representation and Transferability of Chest X-ray Models
MoCo-CXR 将 Momentum Contrast 预训练应用于胸部 X 线图像,产生比 ImageNet 预训练更高质量的表示,并在数据标注有限时具有更好的迁移能力。
Contrastive learning is a form of self-supervision that can leverage unlabeled data to produce pretrained models. While contrastive learning has demonstrated promising results on natural image classification tasks, its application to medical imaging tasks like chest X-ray interpretation has been limited. In this work, we propose MoCo-CXR, which is an adaptation of the contrastive learning method Momentum Contrast (MoCo), to produce models with better representations and initializations for the detection of pathologies in chest X-rays. In detecting pleural effusion, we find that linear models trained on MoCo-CXR-pretrained representations outperform those without MoCo-CXR-pretrained representations, indicating that MoCo-CXR-pretrained representations are of higher-quality. End-to-end fine-tuning experiments reveal that a model initialized via MoCo-CXR-pretraining outperforms its non-MoCo-CXR-pretrained counterpart. We find that MoCo-CXR-pretraining provides the most benefit with limited labeled training data. Finally, we demonstrate similar results on a target Tuberculosis dataset unseen during pretraining, indicating that MoCo-CXR-pretraining endows models with representations and transferability that can be applied across chest X-ray datasets and tasks.
研究动机与目标
- 利用未标注的胸部 X 线数据,通过对比学习预训练来学习鲁棒的表示。
- 针对胸部 X 线的特征,使用合适的数据增强和训练设置来改编 MoCo。
- 在不同标注数据规模下,评估表示质量和对外部数据集的可迁移性。
- 展示使用 MoCo-CXR 初始化进行端到端微调的优势。
- 证明 MoCo-CXR 能够迁移到超出预训练领域的外部数据集。
提出的方法
- 在 CheXpert 上进行预训练,使用针对胸部 X 线的修改 MoCo 设置和特定的数据增强(随机旋转和水平翻转)。
- 从 ImageNet 权重初始化,以在 MoCo 预训练前利用收敛性优势。
- 使用动量对比队列,以实现适合大型 X 线图像的小批量大小。
- 使用 CheXpert 和 Shenzhen 数据进行微调,采用不同标签比例和两种骨干网络(ResNet18、DenseNet121)。
- 通过冻结的骨干网络使用线性分类器评估表示,并评估端到端微调性能。
- 用自举法在 500 次测试重复中评估统计显著性。
实验结果
研究问题
- RQ1在胸部 X 线任务的线性评估中,MoCo-CXR 表现是否优于 ImageNet 预训练的表示?
- RQ2当标注数据稀缺时,MoCo-CXR 预训练是否带来更大收益?
- RQ3从 CheXpert 学习的表示能否迁移到一个具有不同任务的外部胸部 X 线数据集(Shenzhen)?
- RQ4与 ImageNet 初始化相比,MoCo-CXR 初始化是否能提升端到端微调的性能?
主要发现
- MoCo-CXR 预训练的线性模型在线性评估中持续优于 ImageNet 预训练的线性模型,在极低标签比例下收益显著(例如 0.1% 标签:0.096 的 AUC 提升;95% CI 0.061, 0.130)。
- 端到端的 MoCo-CXR 预训练模型在低标签数据比例下获得更大提升(例如 0.1%:0.037 AUC 提升;95% CI 0.015, 0.062)。
- MoCo-CXR 表示迁移到外部 Shenzhen 结核数据集,线性模型在 6.25% 标签比例下对比 ImageNet 提高 0.054 AUC(95% CI 0.024, 0.086)。
- 在 Shenzhen 的端到端改进小于线性迁移,暗示在有限数据下可能趋于饱和,但仍有非零增益。
- MoCo-CXR 的收益在 CheXpert 的多种任务(胸腔积液等)以及两种骨干网络 ResNet18 和 DenseNet121 上持续存在。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。