QUICK REVIEW

[论文解读] SCAN: Structure Correcting Adversarial Network for Organ Segmentation in Chest X-rays

Wei Dai, Joseph Doyle|arXiv (Cornell University)|Mar 26, 2017

COVID-19 diagnosis using AI参考文献 26被引用 28

一句话总结

本文提出SCAN（结构校正对抗网络），通过使用判别器网络强制实施生理结构先验，显著提升了在有限训练数据下的胸部X光片器官分割性能，实现了高度准确且逼真的肺部和心脏分割。该方法在少量标注数据下达到人类水平性能，并在不同患者群体和成像条件下具有良好泛化能力。

ABSTRACT

Chest X-ray (CXR) is one of the most commonly prescribed medical imaging procedures, often with over 2-10x more scans than other imaging modalities such as MRI, CT scan, and PET scans. These voluminous CXR scans place significant workloads on radiologists and medical practitioners. Organ segmentation is a crucial step to obtain effective computer-aided detection on CXR. In this work, we propose Structure Correcting Adversarial Network (SCAN) to segment lung fields and the heart in CXR images. SCAN incorporates a critic network to impose on the convolutional segmentation network the structural regularities emerging from human physiology. During training, the critic network learns to discriminate between the ground truth organ annotations from the masks synthesized by the segmentation network. Through this adversarial process the critic network learns the higher order structures and guides the segmentation model to achieve realistic segmentation outcomes. Extensive experiments show that our method produces highly accurate and natural segmentation. Using only very limited training data available, our model reaches human-level performance without relying on any existing trained model or dataset. Our method also generalizes well to CXR images from a different patient population and disease profiles, surpassing the current state-of-the-art.

研究动机与目标

解决在标注数据有限的低资源、高度多变的胸部X光片（CXR）图像中实现精确器官分割的挑战。
将隐式的生理结构知识（如解剖邻接关系和轮廓特征点）融入深度学习模型，以提升分割结果的真实感。
开发一种方法，在不依赖预训练模型或外部数据集的前提下，实现对不同患者群体、疾病谱系和成像质量的泛化能力。
仅使用极少的标注训练数据，实现人类水平的分割性能。

提出的方法

SCAN采用全卷积网络（FCN）作为分割头，通过对抗训练与判别器网络联合端到端训练，以强制实现结构真实性。
判别器网络用于区分真实器官掩码与分割网络生成的掩码，从而从生理约束中学习高阶结构规律。
通过对抗训练，判别器引导分割网络生成更具解剖学合理性的轮廓，尤其在肋膈角和血管边界等模糊区域表现更优。
该框架无需外部预训练模型或领域特定数据，支持零样本泛化至新数据集。
推理阶段高效，仅需通过分割网络进行一次前向传播，部署时无需使用判别器。
该方法在JSRT和Montgomery胸部X光片数据集上进行训练与评估，二者在对比度、病理特征和成像协议方面存在显著差异。

实验结果

研究问题

RQ1使用结构感知判别器的对抗训练是否能超越标准FCN基线，在胸部X光片中实现肺部和心脏语义分割的性能提升？
RQ2在未进行预训练或领域自适应的情况下，仅在小规模数据集上训练的模型在多大程度上可实现人类水平性能？
RQ3该方法在不同患者群体和成像条件下，对胸部X光片的泛化能力如何？
RQ4判别器网络是否能有效学习并强制实施如解剖邻接关系和轮廓特征点等生理结构先验？
RQ5所提出方法的推理速度是否显著快于现有的基于配准的最先进方法？

主要发现

在JSRT评估集上，SCAN的交并比（IoU）达到91.4% ± 0.6%，优于基于配准的先前最先进方法（90.3% ± 0.5%）。
在更具挑战性的Montgomery数据集上——该数据集具有更高的病理负担和成像变异性——SCAN的IoU达到93.0% ± 1.4%，显著优于FCN基线（87.1% ± 0.8%）。
当在JSRT与Montgomery的开发集联合训练时，SCAN在JSRT上达到95.1% ± 0.43%的IoU，在Montgomery上达到93.0% ± 1.4%，展现出强大的泛化能力。
SCAN生成的轮廓更加真实且清晰，尤其在关键解剖标志点如肋膈角处表现突出，这些区域对胸腔积液和肺过度通气的诊断至关重要。
测试推理时间仅为每张400×400图像0.84秒，显著快于基于配准的最先进方法所需的26秒。
该方法在无需超参数调优的情况下，对不同数据集表现出良好泛化能力，表明其对对比度、病理特征和成像质量变化具有强鲁棒性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。