[论文解读] CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
CheXNet 是一个在 ChestX-ray14 上训练的 121 层 DenseNet,能够检测胸部 X 光片中的肺炎,其性能可与放射科医生匹敌甚至优于放射科医生,并扩展到所有 14 种疾病,达到最先进水平。此外,它还提供热图(CAMs)来定位病理区域。
We develop an algorithm that can detect pneumonia from chest X-rays at a level exceeding practicing radiologists. Our algorithm, CheXNet, is a 121-layer convolutional neural network trained on ChestX-ray14, currently the largest publicly available chest X-ray dataset, containing over 100,000 frontal-view X-ray images with 14 diseases. Four practicing academic radiologists annotate a test set, on which we compare the performance of CheXNet to that of radiologists. We find that CheXNet exceeds average radiologist performance on the F1 metric. We extend CheXNet to detect all 14 diseases in ChestX-ray14 and achieve state of the art results on all 14 diseases.
研究动机与目标
- 开发一款用于胸部 X 光片的自动化肺炎检测模型,其性能超过执业放射科医生。
- 利用 ChestX-ray14 数据集训练用于多种胸腔病变的深度网络。
- 提供定位热图以指示对预测有贡献的区域。
提出的方法
- 使用在 ImageNet 上预训练的 121 层 DenseNet,输出一个单独的 sigmoid 值表示肺炎存在。
- 使用加权二元交叉熵来处理类别不平衡(权重 w+ 和 w−)。
- 使用 Adam 进行端到端训练,基于验证损失进行学习率调度。
- 将模型扩展为输出一个 14 类向量,并对所有病理独立使用二元交叉熵损失。
- 使用引导自助法(bootstrap)置信区间在 420 张图像的测试集上与放射科医生对比评估 F1 分数。
实验结果
研究问题
- RQ1深度卷积神经网络能在胸部 X 光片上达到放射科医生水平的肺炎检测性能吗?
- RQ2将模型扩展到 14 种病理后,是否在所有类别上实现了最先进的 AUROC?
- RQ3类激活图是否能够对肺炎相关区域在 X 光片中进行有意义的定位?
主要发现
- CheXNet 实现了 F1 分数 0.435(95% 置信区间 0.387, 0.481),高于放射科医生平均值 0.387(95% 置信区间 0.330, 0.442)。
- CheXNet 的肺炎检测性能在统计上显著高于放射科医生(差值 0.051,95% 置信区间 0.005, 0.084)。
- 在 ChestX-ray14 上,CheXNet 在所有 14 种病理类别上优于之前的最先进方法(按类别 AUROC)。
- CheXNet 对质量为 Mass、Nodule、Pneumonia 和 Emphysema 的改进尤为显著(AUROC 增益 >0.05)。
- 该模型提供类激活图,以定位对预测有贡献的区域。
- CheXNet 的训练使用 112,120 张图像,在 420 张经放射科医生评估的肺炎测试集中进行评估。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。