[论文解读] Evaluation of Deep Segmentation Models for the Extraction of Retinal Lesions from Multi-modal Retinal Images
本研究评估了六种深度分割模型——RAGNet、PSPNet、SegNet、UNet、FCN-8 和 FCN-32——在多模态眼底和OCT图像中提取视网膜病灶的表现。RAGNet 在平均Dice系数(D_C = 0.822)上表现最佳,而UNet在微屑(drusen)检测中表现最优(D_C = 0.864),表明不同病灶类型和成像模态下模型性能存在差异。
Identification of lesions plays a vital role in the accurate classification of retinal diseases and in helping clinicians analyzing the disease severity. In this paper, we present a detailed evaluation of RAGNet, PSPNet, SegNet, UNet, FCN-8 and FCN-32 for the extraction of retinal lesions such as intra-retinal fluid, sub-retinal fluid, hard exudates, drusen, and other chorioretinal anomalies from retinal fundus and OCT scans. We also discuss the transferability of these models for extracting retinal lesions by varying training-testing dataset pairs. A total of 363 fundus and 173,915 OCT scans were considered in this evaluation from seven publicly available datasets from which 297 fundus and 59,593 OCT scans were used for testing purposes. Overall, the best performance is achieved by RAGNet with a mean dice coefficient ($\mathrm{D_C}$) score of 0.822 for extracting retinal lesions. The second-best performance is achieved by PSPNet (mean $\mathrm{D_C}$: 0.785) using ResNet extsubscript{50} as a backbone. Moreover, the best performance for extracting drusen is achieved by UNet ($\mathrm{D_C}$: 0.864). The source code is available at: this http URL.
研究动机与目标
- 评估多种深度学习架构在从多模态眼底成像数据中分割不同类型视网膜病灶方面的性能。
- 研究训练模型在不同眼底和OCT数据集之间迁移的可行性。
- 识别在特定病灶类型(如微屑、硬性渗出物和液体积聚)中表现最佳的模型架构。
- 利用大规模公开数据集,为视网膜病灶分割提供全面的基准测试。
提出的方法
- 本研究在来自七个公开数据集的363张眼底图像和173,915张OCT扫描图像组成的联合数据集上,评估了RAGNet、PSPNet、SegNet、UNet、FCN-8和FCN-32。
- 使用297张眼底图像和59,593张OCT扫描图像进行训练和测试,性能通过Dice系数(D_C)衡量。
- 通过改变训练和测试数据集的组合,分析模型在不同数据分布间的泛化能力,以评估其可迁移性。
- PSPNet使用ResNet-50作为主干网络,其余模型均采用其标准架构,未进行结构修改。
- 所有模型均使用标准深度学习流程进行训练和评估,损失函数为交叉熵损失,并应用数据增强技术。
- 源代码已公开发布,以支持可复现性及后续基准测试。
实验结果
研究问题
- RQ1在多模态眼底成像中,哪种深度分割模型在整体分割视网膜病灶方面表现最佳?
- RQ2当在不同眼底和OCT数据集之间迁移时,模型性能如何变化?
- RQ3在特定病灶类型(如微屑、视网膜内液积聚或硬性渗出物)中,哪种模型表现最佳?
- RQ4模型架构的选择对视网膜成像中病灶分割准确率有何影响?
主要发现
- RAGNet在所有病灶类型上的平均Dice系数(D_C = 0.822)最高,优于所有其他模型。
- 采用ResNet-50主干网络的PSPNet以0.785的平均D_C排名第二,表明其在各类病灶间具有较强的泛化能力。
- UNet在微屑分割中表现最佳,Dice系数达0.864,显著优于其他模型在该特定病灶类型上的表现。
- 本研究表明,模型性能在不同病灶类型间存在显著差异,不存在对所有病灶类别均最优的单一模型。
- 在不同数据集间存在一定的可迁移性,但性能下降明显,尤其当训练与测试数据分布差异较大时。
- 研究结果建立了一个全面的视网膜病灶分割基准,揭示了不同病理类型下特定架构的优势。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。