[论文解读] Self-Supervised ImageNet Representations for In Vivo Confocal Microscopy: Tortuosity Grading without Segmentation Maps
论文表明自监督的 ImageNet 特征(DINO 变体)可以在没有分割图的情况下对体内共聚焦显微镜(IVCM)中的角膜神经缠度进行分级,并在微调后达到最新水平。
The tortuosity of corneal nerve fibers are used as indication for different diseases. Current state-of-the-art methods for grading the tortuosity heavily rely on expensive segmentation maps of these nerve fibers. In this paper, we demonstrate that self-supervised pretrained features from ImageNet are transferable to the domain of in vivo confocal microscopy. We show that DINO should not be disregarded as a deep learning model for medical imaging, although it was superseded by two later versions. After careful fine-tuning, DINO improves upon the state-of-the-art in terms of accuracy (84,25%) and sensitivity (77,97%). Our fine-tuned model focuses on the key morphological elements in grading without the use of segmentation maps.
研究动机与目标
- 展示 ImageNet 预训练的自监督特征向 IVCM 缠度分级的可迁移性。
- 在 CORN 数据集上对 DINO、DINOv2 和 DINOv3 表征进行线性探测评估。
- 对最佳性能的骨干网络进行微调,以在没有分割图的前提下最大化分级准确性和灵敏度。
提出的方法
- 使用带有四级缠度标签的 CORN1500 和 CORN-3 数据集。
- 通过在冻结的骨干网络上附加单个线性层并训练 100 个时期来评估线性探测。
- 选择表现最佳的 DINO 变体(DINO ViT-B)进行微调,部分冻结骨干网络并使用 AdamW 优化。
- 采用线性预热和余弦衰减调度进行微调,在单个 GPU 上应用早停。
- 将性能与依赖分割图的最先进方法进行对比。
实验结果
研究问题
- RQ1自监督的 ImageNet 表征是否能在没有分割图的情况下实现 IVCM 的缠度分级?
- RQ2哪种 DINO 版本和模型大小在缠度分类的线性探测中表现最佳?
- RQ3对冻结骨干网络的 DINO 进行微调是否能将缠度分级提升到最先进水平?
- RQ4得到的注意力图是否聚焦于解剖学上相关的神经纤维特征(分支点、曲率较高的片段)?
主要发现
- 冻结的 DINO 表征在 CORN-3 上实现了具有竞争力的线性探测性能,其中 DINO ViT-B/16 通常在各指标之间取得最佳平衡。
- 对 DINO ViT-B/16 进行微调在没有分割图的情况下达到最先进的结果:wAcc 84.25%、wSe 77.97%、wSp 84.81%(在 CORN-3 上)。
- 在这项任务的线性探测中,采用更大或更新骨干网络的 DINO 变体通常不及 DINO ViT-B/16。
- 微调后注意力图表明模型将注意力集中在与缠度相关的区域,如分支点和曲线段。
- 在 CORN-3-noD 上,微调的 DINO ViT-B/16 达到 wAcc 83.71%、wSe 75.88%、wSp 87.92%。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。