[论文解读] Large Scale Automated Reading of Frontal and Lateral Chest X-Rays using Dual Convolutional Neural Networks
论文在大型的 MIMIC-CXR 数据集上训练 CNN 以识别前视和侧视胸片中的 14 种胸部病变,并提出 DualNet 以联合处理成对的前视和侧视图,相较于独立模型提升性能。
The MIMIC-CXR dataset is (to date) the largest released chest x-ray dataset consisting of 473,064 chest x-rays and 206,574 radiology reports collected from 63,478 patients. We present the results of training and evaluating a collection of deep convolutional neural networks on this dataset to recognize multiple common thorax diseases. To the best of our knowledge, this is the first work that trains CNNs for this task on such a large collection of chest x-ray images, which is over four times the size of the largest previously released chest x-ray corpus (ChestX-Ray14). We describe and evaluate individual CNN models trained on frontal and lateral CXR view types. In addition, we present a novel DualNet architecture that emulates routine clinical practice by simultaneously processing both frontal and lateral CXR images obtained from a radiological exam. Our DualNet architecture shows improved performance in recognizing findings in CXR images when compared to applying separate baseline frontal and lateral classifiers.
研究动机与目标
- 在 MIMIC-CXR 数据集上演示大规模自动胸部疾病分类。
- 评估前视(PA/AP)和侧视视图特定的 CNN 的多标签分类。
- 提出并评估同时处理前视和侧视 X 影的 DualNet 架构。
- 将 DualNet 与单独前视和侧视分类器进行比较,以量化性能提升。
提出的方法
- 使用基于 DenseNet-121 的单独 CNN(输入为 1 通道)对 PA、AP 和侧视视图进行多标签二元交叉熵训练。
- 使用 12–128 个网络,带全局平均池化和最终 14 类的 sigmoid 输出。
- 应用来自放射科报告的 NegBio 派生标签,将其映射到 14 种胸部发现(或 No Finding)。
- 对图像进行 512x512 的缩放处理,同时保持纵横比并归一化到 [0,1]。
- 训练将前视和侧视网络的输出在最终分类器前进行拼接,从而得到 DualNet 的变体。
- 在受试者拆分的测试集上按类别计算 AUC 进行评估;将 DualNet 与单视角基线进行比较。
实验结果
研究问题
- RQ1使用 MIMIC-CXR 数据集训练的 CNN 能否从前视和侧视胸片中准确识别常见胸部疾病?
- RQ2通过 DualNet 架构将前视和侧视整合是否比独立视图模型提升分类性能?
- RQ3PA、AP 与 Lateral 视图在特定发现的检测性能上有何差异?
- RQ4使用成对的前视-侧视数据对多标签胸部疾病检测有什么影响?
主要发现
| 发现 | PA | AP | Lateral | Average |
|---|---|---|---|---|
| 肺不张 | 0.760 | 0.666 | 0.753 | |
| 心脏增大 | 0.868 | 0.746 | 0.794 | |
| 实变 | 0.637 | 0.601 | 0.644 | |
| 水肿 | 0.736 | 0.745 | 0.766 | |
| 胸腔积液 | 0.719 | 0.740 | 0.754 | |
| 肺纤维化 | 0.706 | 0.643 | 0.666 | |
| 疝气 | 0.731 | 0.742 | 0.788 | |
| 浸润 | 0.779 | 0.525 | 0.731 | |
| 肿块 | 0.646 | 0.624 | 0.680 | |
| 无异常 | 0.742 | 0.677 | 0.765 | |
| 结节 | 0.534 | 0.603 | 0.556 | |
| 胸膜增厚 | 0.688 | 0.620 | 0.660 | |
| 肺炎 | 0.611 | 0.602 | 0.635 | |
| 气胸 | 0.672 | 0.631 | 0.686 | |
| Average | 0.702 | 0.655 | 0.706 |
- 在前视视图中,PA 模型的平均 AUC 最高(0.702),而 AP 为 0.655。
- 在单视图模型中,侧视模型的平均 AUC 最高(0.706)。
- DualNet 在大多数 PA+Lateral(12/14)和 AP+Lateral(10/14)情形下持续优于单独前视和侧视分类器。
- 对于 PA+Lateral,DualNet 平均 AUC = 0.721,而独立模型为 0.690。
- 对于 AP+Lateral,DualNet 平均 AUC = 0.668,而独立模型为 0.637。
- 总体而言,双视图的联合处理在若干发现上带来稳健的提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。