[论文解读] BCN20000: Dermoscopic Lesions in the Wild
本文介绍了 BCN20000 数据集,包含来自 5,583 例皮损(2010–2016)的 19,424 张皮肤镜图像,用于研究无约束的皮肤癌分类并支持 ISIC Challenge 2019。
This article summarizes the BCN20000 dataset, composed of 19424 dermoscopic images of skin lesions captured from 2010 to 2016 in the facilities of the Hospital Clínic in Barcelona. With this dataset, we aim to study the problem of unconstrained classification of dermoscopic images of skin cancer, including lesions found in hard-to-diagnose locations (nails and mucosa), large lesions which do not fit in the aperture of the dermoscopy device, and hypo-pigmented lesions. The BCN20000 will be provided to the participants of the ISIC Challenge 2019, where they will be asked to train algorithms to classify dermoscopic images of skin cancer automatically.
研究动机与目标
- 促使研究在超越精心整理数据集的无约束皮肤镜图像分类。
- 提供一个规模较大、临床多样性强的数据集,包含难以诊断的位置和病变类型。
- 将图像与元数据(解剖位置、患者年龄和性别)关联,以模拟临床实践。
- 使算法能够在分布外和具有挑战性的情景中进行评估。
- 通过一个与诊断相关联的稳健公共数据集,支持 ISIC Challenge 2019。
提出的方法
- 整理了来自巴塞罗那临床医院(Hospital Clínic de Barcelona)的皮肤镜图像的16年收藏(2010–2016)。
- 使用计算机视觉技术检索、整理和筛选图像,并将其与参考数据库中的诊断相关联。
- 由多位阅片者手动修订诊断,以确保可行性和质量。
- 包含病变位置、年龄和性别等元数据,以反映临床工作流程。
- 为 ISIC Challenge 2019 和 ISIC Archive 分发准备数据集。
实验结果
研究问题
- RQ1包含难以诊断位置的无约束皮肤镜图像数据集如何影响自动皮肤癌分类的性能?
- RQ2算法能否处理野外出现的分布外或不可分割/低色素病变?
- RQ3在实践中,随附元数据(位置、年龄、性别)对病变分类的价值何在?
- RQ4与现有数据集在多样性和诊断类别方面,BCN20000 的表现如何?
主要发现
- BCN20000 数据集包含 19,424 张高质量皮肤镜图像,对应 5,583 例皮损,拍摄时间在 2010 到 2016 之间。
- 图像覆盖九个类别:色素痣、黑色素瘤、基底细胞癌、脂溢性角化病、日光性角化病、鳞状细胞癌、皮肤纤维瘤、血管病变及其他。
- 图像附带解剖位置和患者人口统计学信息的元数据,以反映临床实践。
- 该数据集旨在用于 ISIC Challenge 2019,以评估自动分类和分布外检测。
- 数据收集与共享已获得伦理批准。
- 通过从医院记录转介,对图像进行策展和验证,以确保诊断的可信性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。