QUICK REVIEW

[论文解读] A New 2.5D Representation for Lymph Node Detection using Random Sets of Deep Convolutional Neural Network Observations

Holger R. Roth, Le Lü|arXiv (Cornell University)|Jun 6, 2014

AI in cancer detection参考文献 17被引用 416

一句话总结

本文提出一种2.5D深度学习方法，通过从3D感兴趣体积（VOI）生成多个随机的2D重新格式化视图（轴向、冠状、矢状），用于训练卷积神经网络（CNN）以减少假阳性，实现CT扫描中淋巴结（LN）检测。通过对每个VOI的100个随机视图的预测结果进行平均，该方法在纵隔区域实现每体积3个假阳性时70%的敏感度，在腹部区域实现83%的敏感度，显著优于先前的最先进方法。

ABSTRACT

Automated Lymph Node (LN) detection is an important clinical diagnostic task but very challenging due to the low contrast of surrounding structures in Computed Tomography (CT) and to their varying sizes, poses, shapes and sparsely distributed locations. State-of-the-art studies show the performance range of 52.9% sensitivity at 3.1 false-positives per volume (FP/vol.), or 60.9% at 6.1 FP/vol. for mediastinal LN, by one-shot boosting on 3D HAAR features. In this paper, we first operate a preliminary candidate generation stage, towards 100% sensitivity at the cost of high FP levels (40 per patient), to harvest volumes of interest (VOI). Our 2.5D approach consequently decomposes any 3D VOI by resampling 2D reformatted orthogonal views N times, via scale, random translations, and rotations with respect to the VOI centroid coordinates. These random views are then used to train a deep Convolutional Neural Network (CNN) classifier. In testing, the CNN is employed to assign LN probabilities for all N random views that can be simply averaged (as a set) to compute the final classification probability per VOI. We validate the approach on two datasets: 90 CT volumes with 388 mediastinal LNs and 86 patients with 595 abdominal LNs. We achieve sensitivities of 70%/83% at 3 FP/vol. and 84%/90% at 6 FP/vol. in mediastinum and abdomen respectively, which drastically improves over the previous state-of-the-art work.

研究动机与目标

为解决从低对比度、表现多变的CT扫描中自动检测淋巴结时假阳性率过高的挑战。
在保持纵隔和腹部淋巴结临床可接受的假阳性率（FP/vol.）的同时，提高检测敏感度。
开发一种2.5D表示方法，使标准2D CNN能够有效进行3D目标分类，而无需使用完整的3D卷积神经网络。
将初始CADe系统（约100%敏感度，约40个FP/患者）的假阳性数量减少至临床可行水平。

提出的方法

初步CADe系统生成约94–97%敏感度和约25–35个FP/vol.的淋巴结候选区域，作为本方法的输入。
每个3D VOI通过随机缩放（4种尺度）、3D平移（最大3 mm）和绕随机轴旋转（0°–360°）的方式重采样为N = 100个随机2D图像块。
每个2D图像块通过将通过VOI中心的轴向、冠状和矢状切片分别分配给R、G和B通道生成。
在这些三通道2D图像块上训练深度CNN，以分类每个图像块为淋巴结或非淋巴结，并通过随机变换进行数据增强，以防止过拟合。
在推理阶段，CNN对每个VOI的所有N个随机视图进行预测，其概率值被平均以计算最终的单个候选分类概率。
通过调整最终决策阈值生成FROC曲线，并采用自由响应ROC分析评估性能。

实验结果

研究问题

RQ1与3D CNN或2D方法相比，使用3D VOI的随机2D重新格式化视图的2.5D表示是否能提高淋巴结检测的敏感度并减少假阳性？
RQ2通过随机缩放、平移和旋转进行的数据增强在提升低对比度CT扫描中淋巴结分类的CNN泛化能力方面有多有效？
RQ3对同一3D VOI的多个随机2D视图的预测结果进行平均，是否能获得优于单视图或集成方法的分类性能？
RQ4在纵隔和腹部淋巴结上联合训练单个CNN模型，是否能通过更大、更多样化的训练数据提升泛化能力和性能，优于分别训练的模型？
RQ5考虑到其训练和推理时间，该提出的2.5D方法在计算效率和临床集成可扩展性方面是否足够高效？

主要发现

在纵隔区域，该方法在每体积3个假阳性时达到70%的敏感度，显著优于先前最先进方法在3.1个FP/vol.时的52.9%敏感度。
在腹部区域，该方法在每体积3个假阳性时达到83%的敏感度，超过先前最佳结果（13.0个FP/vol.时的70.5%敏感度）。
在腹部区域，受试者工作特征曲线下面积（AUC）从0.76提升至0.942，表明分类性能有显著提升。
FROC曲线在N ≥ 25个随机视图时迅速趋于饱和，表明性能在中等增强量（N = 100）时已稳定，此设置下为最优。
在纵隔和腹部数据上联合训练使纵隔区域在3个FP/vol.时的敏感度提高了约10%，表明更大、更多样化的训练数据具有显著优势。
简单的CNN预测结果平均法优于更复杂的融合策略，表明深度CNN的预测结果质量高且具有一致性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。