[论文解读] XLSor: A Robust and Accurate Lung Segmentor on Chest X-Rays Using Criss-Cross Attention and Customized Radiorealistic Abnormalities Generation
XLSor 引入交叉注意力以在胸部 X 线片上实现全局上下文的肺部分割鲁棒性,并使用放射真实感异常 CXR 数据增强来提升对异常和正常 CXR 的鲁棒性,从而获得更优性能。
This paper proposes a novel framework for lung segmentation in chest X-rays. It consists of two key contributions, a criss-cross attention based segmentation network and radiorealistic chest X-ray image synthesis (i.e. a synthesized radiograph that appears anatomically realistic) for data augmentation. The criss-cross attention modules capture rich global contextual information in both horizontal and vertical directions for all the pixels thus facilitating accurate lung segmentation. To reduce the manual annotation burden and to train a robust lung segmentor that can be adapted to pathological lungs with hazy lung boundaries, an image-to-image translation module is employed to synthesize radiorealistic abnormal CXRs from the source of normal ones for data augmentation. The lung masks of synthetic abnormal CXRs are propagated from the segmentation results of their normal counterparts, and then serve as pseudo masks for robust segmentor training. In addition, we annotate 100 CXRs with lung masks on a more challenging NIH Chest X-ray dataset containing both posterioranterior and anteroposterior views for evaluation. Extensive experiments validate the robustness and effectiveness of the proposed framework. The code and data can be found from https://github.com/rsummers11/CADLab/tree/master/Lung_Segmentation_XLSor .
研究动机与目标
- 促进胸部 X 线的准确肺部分割,以帮助跨越正常和异常病例的自动诊断。
- 开发一个分割框架,利用 criss-cross attention (CCA) 捕捉全局上下文信息。
- 通过放射真实感异常 CXR 生成和伪掩码来减少标注负担,以实现鲁棒训练。
- 在包括 NIH Chest X-rays 的 PA 和 AP 视图数据集上进行评估,以测试泛化能力。
提出的方法
- 在 CNN 骨干网络中使用 criss-cross attention 模块以捕获像素级分割的水平和垂直全局上下文。
- 用扩张卷积替代最后的下采样层,以实现步幅为 8 的高分辨率上下文。
- 采用两层 CCA 循环结构以密集地收集上下文信息。
- 通过 MUNIT 将普通 CXR 转变为放射真实感异常 CXR,并将普通掩码传播为伪掩码用于训练增强。
- 使用真实数据和增强数据训练 XLSor;在对比 U-Net 基线进行评估。
- 对 100 张异常 NIH CXR 进行标注以测试泛化。
实验结果
研究问题
- RQ1criss-cross attention 能否改善对 CXR 的全局上下文推理,从而在异常/病理条件下实现更准确的肺部分割?
- RQ2放射真实感增强与伪掩码是否提升对未知异常 CXR 的鲁棒性和泛化能力(包括 PA 和 AP 视图)?
- RQ3XLSor 相较于标准 U-Net 基线在正常和异常 CXR 分割设置下的表现如何?
主要发现
| CXR 掩膜 | U-Net R | U-Net A^4 | U-Net R+A^4 | XLSor R | XLSor A^4 | XLSor R+A^4 |
|---|---|---|---|---|---|---|
| REC | 0.976 ± 0.02 | 0.963 ± 0.03 | 0.972 ± 0.02 | 0.973 ± 0.02 | 0.967 ± 0.02 | 0.974 ± 0.02 |
| PRE | 0.968 ± 0.03 | 0.979 ± 0.02 | 0.970 ± 0.03 | 0.979 ± 0.02 | 0.983 ± 0.01 | 0.976 ± 0.01 |
| DICE | 0.972 ± 0.02 | 0.971 ± 0.02 | 0.975 ± 0.01 | 0.976 ± 0.01 | 0.973 ± 0.01 | 0.975 ± 0.01 |
| AVD | 0.198 ± 0.56 | 0.162 ± 0.36 | 0.131 ± 0.34 | 0.149 ± 0.51 | 0.098 ± 0.07 | 0.078 ± 0.06 |
| VS | 0.988 ± 0.02 | 0.989 ± 0.01 | 0.990 ± 0.01 | 0.992 ± 0.01 | 0.991 ± 0.01 | 0.993 ± 0.01 |
- XLSor 在公共测试集和 NIH 数据集上均优于 U‑Net,在未见异常 CXR 上的提升尤为明显(如 Dice 分数改善)。
- 添加放射真实感增强样本(A^i)相较仅使用真实数据稳定地提升性能。
- 使用带有 CCA 模块的 criss-cross attention 能提升全局上下文学习,尤其在具有挑战性的情况下获得更好分割。
- 使用增强数据训练的模型(R+A^4)在 NIH 数据上表现稳健,表明对更复杂异常 CXR 的泛化能力良好。
- 即使仅用增强数据(A^4)进行训练,XLSor 在公共数据集和 NIH 数据集上也能取得竞争性结果,显示伪掩码监督的有效性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。