Skip to main content
QUICK REVIEW

[论文解读] GraphX$^{NET}-$ Chest X-Ray Classification Under Extreme Minimal Supervision

Angelica I. Avilés-Rivero, Nicolas Papadakis|arXiv (Cornell University)|Jul 23, 2019
COVID-19 diagnosis using AI参考文献 18被引用 29
一句话总结

该论文提出 GraphX${}^\text{NET}$,一种新颖的基于图的半监督学习框架,用于胸部X光片分类,在仅使用20%标注数据的情况下实现了最先进性能,展示了在极端极少监督条件下的高准确率和鲁棒性。该方法利用带有类别先验的归一化p-Laplacian,通过图结构优化模型在未标注数据上平滑传播标签。

ABSTRACT

The task of classifying X-ray data is a problem of both theoretical and clinical interest. Whilst supervised deep learning methods rely upon huge amounts of labelled data, the critical problem of achieving a good classification accuracy when an extremely small amount of labelled data is available has yet to be tackled. In this work, we introduce a novel semi-supervised framework for X-ray classification which is based on a graph-based optimisation model. To the best of our knowledge, this is the first method that exploits graph-based semi-supervised learning for X-ray data classification. Furthermore, we introduce a new multi-class classification functional with carefully selected class priors which allows for a smooth solution that strengthens the synergy between the limited number of labels and the huge amount of unlabelled data. We demonstrate, through a set of numerical and visual experiments, that our method produces highly competitive results on the ChestX-ray14 data set whilst drastically reducing the need for annotated data.

研究动机与目标

  • 解决胸部X光片分类中低质量且稀缺的标注医学影像数据这一关键挑战。
  • 克服监督深度学习方法对大规模、可能存在偏差的标注数据集的依赖。
  • 开发一种半监督框架,有效利用大量未标注数据,在极端标注稀缺条件下提升分类性能。
  • 提出一种新型多类别分类泛函,结合定制的类别先验,以增强图上的标签传播和解的平滑性。
  • 首次将基于图的半监督学习应用于胸部X光片分类,展示了其在医学影像中的潜力。

提出的方法

  • 将胸部X光片数据集表示为无向加权图,其中节点对应图像,边按特征相似度加权。
  • 使用归一化的、非光滑的p=1拉普拉斯算子,将分类任务表述为图优化问题,以确保鲁棒性和稀疏性。
  • 设计一种新型多类别分类泛函,其类别先验基于数据统计信息,以引导标签传播并提升解的平滑性。
  • 使用原始-对偶算法求解优化问题,最小化基于图的能量泛函,同时满足标注数据的约束。
  • 应用归纳学习:利用完整的图结构,同时预测所有节点(标注和未标注)的标签。
  • 使用图拉普拉斯算子在相邻节点间强制预测平滑性,降低对噪声或错误标注训练样本的敏感性。

实验结果

研究问题

  • RQ1基于图的半监督学习框架能否在大幅减少标注数据的情况下,实现胸部X光片图像的有竞争力分类准确率?
  • RQ2与标准图方法相比,所提出的结合优化类别先验的方法在标签传播和解平滑性方面有何改进?
  • RQ3与监督深度学习基线相比,该框架在数据划分和标签集变化下的性能有多大的鲁棒性?
  • RQ4当仅使用20%的标注数据进行训练时,基于图的半监督学习能否超越最先进深度学习模型?
  • RQ5在医学图像分类中,使用归一化的p=1拉普拉斯算子是否相比传统的p=2公式能带来更稳定和准确的预测?

主要发现

  • GraphX${}^\text{NET}$ 在仅使用20%标注数据的情况下,在 ChestX-ray14 数据集上实现了平均AUC为0.7888,优于如Wang等人(2017)和Yao等人(2018)的最先进深度学习方法。
  • 该方法在不同随机数据划分下保持高度稳定性,AUC波动极小,而监督基线方法则对训练集组成高度敏感。
  • 仅使用5%标注数据时,GraphX${}^\text{NET}$ 的AUC达到0.58,高于Wang等人(2017)在70%数据上训练的结果(AUC = 0.548)。
  • 该框架在14种病理中的10种上表现更优,尤其在肺炎(AUC 0.7664 vs. 0.658)和肿块(AUC 0.809 vs. 0.693)等困难类别上提升显著。
  • 在泛函中引入类别先验可实现更平滑的标签传播和更好的泛化能力,尤其在低数据场景下表现突出。
  • 该方法证明,基于图的半监督学习不仅可行,而且在标注数据稀缺时对医学图像分类极具有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。