Skip to main content
QUICK REVIEW

[论文解读] Spectral Data Augmentation Techniques to quantify Lung Pathology from CT-images

Subhradeep Kayal, Florian Dubost|arXiv (Cornell University)|Apr 24, 2020
Radiomics and Machine Learning in Medical Imaging参考文献 18被引用 5
一句话总结

本文提出一种基于离散余弦变换(DCT)和离散小波变换(DWT)的频谱数据增强方法,用于提升CT扫描中肺部病灶的分割性能。通过向频谱分量添加噪声,该方法生成模拟扫描协议差异的合成图像,显著提升模型性能——尤其在与现有增强方法结合时,使病灶类别的F1分数相对提升了44.1%。

ABSTRACT

Data augmentation is of paramount importance in biomedical image processing tasks, characterized by inadequate amounts of labelled data, to best use all of the data that is present. In-use techniques range from intensity transformations and elastic deformations, to linearly combining existing data points to make new ones. In this work, we propose the use of spectral techniques for data augmentation, using the discrete cosine and wavelet transforms. We empirically evaluate our approaches on a CT texture analysis task to detect abnormal lung-tissue in patients with cystic fibrosis. Empirical experiments show that the proposed spectral methods perform favourably as compared to the existing methods. When used in combination with existing methods, our proposed approach can increase the relative minor class segmentation performance by 44.1% over a simple replication baseline.

研究动机与目标

  • 解决生物医学图像分割中的类别不平衡与标注数据有限问题,特别是针对囊性纤维化等罕见肺部病灶。
  • 通过生成多样化且逼真的合成训练样本,提升深度学习模型在低数据量场景下的泛化能力。
  • 探索频域数据增强作为空间域方法的补充策略。
  • 评估DCT和DWT在提升肺部CT图像分割性能方面的有效性。
  • 确定在临床影像任务中,频谱增强的最优噪声水平与组合策略。

提出的方法

  • 对CT图像应用离散余弦变换(DCT),将其分解为频率分量,随后向系数添加与尺度成比例的高斯噪声,以生成合成图像。
  • 使用离散小波变换(DWT)在多尺度下将图像分解为近似系数与细节系数,实现局部频率分析。
  • 在对频谱系数施加与幅度成比例的噪声后,通过逆DCT或逆DWT重构合成图像。
  • 通过参数η控制噪声强度,该参数设定最大噪声水平相对于每个系数值的比值,R值在0到η之间线性采样。
  • 将频谱增强与标准数据增强技术(如仿射变换、弹性形变、强度偏移)结合,以增强模型鲁棒性。
  • 在增强后的数据上训练U-Net模型,并应用形态学孔洞填充以优化像素级分割输出。

实验结果

研究问题

  • RQ1基于DCT和DWT的频谱数据增强是否能在低资源生物医学影像设置中提升分割性能?
  • RQ2与传统的空间域增强方法(如弹性形变和仿射变换)相比,频谱增强的性能表现如何?
  • RQ3在频谱分量中生成有效合成训练样本的最优噪声水平(η)是多少?
  • RQ4将频谱增强与现有数据增强方法结合,是否能实现模型泛化能力的协同提升?
  • RQ5频谱增强是否有助于减少过拟合并提升肺组织分割中少数类(病灶)的F1分数?

主要发现

  • 基于DWT的频谱增强方法在η = 0.5%时于测试集上取得最高F1分数(0.34581),优于所有其他单独的增强技术。
  • 当与仿射变换和弹性形变结合时,DWT@0.5%增强使病灶类别的F1分数相比简单数据复制提升了44.1%。
  • 随着噪声水平(η)升高,频谱方法的性能下降,表明多样性与信号保真度之间存在权衡。
  • DWT基增强优于DCT基增强,可能因其能更好地捕捉局部频率信息。
  • 将频谱增强与标准方法(仿射、弹性、强度)结合,获得最佳整体性能,其F1分数比第二好的单独方法高出10.3%。
  • 结果表明,频谱增强为空间域方法提供了互补信息,增强了模型对扫描协议差异的鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。