QUICK REVIEW

[論文レビュー] GraphX$^{NET}-$ Chest X-Ray Classification Under Extreme Minimal Supervision

Angelica I. Avilés-Rivero, Nicolas Papadakis|arXiv (Cornell University)|Jul 23, 2019

COVID-19 diagnosis using AI参考文献 18被引用数 29

ひとこと要約

本論文は、胸郭レントゲン画像分類のための新しいグラフベースの半教師あり学習フレームワークであるGraphX${}^\text{NET}$を提案する。20%のラベル付きデータのみを用いて最先端の性能を達成しており、極めて少ないラベル付きデータでも高い精度と頑健性を示す。この手法は、クラス事前分布を用いた正規化されたp-ラプラシアンを活用し、グラフ構造の最適化モデルにより、ラベルを未ラベルデータに滑らかに伝搬する。

ABSTRACT

The task of classifying X-ray data is a problem of both theoretical and clinical interest. Whilst supervised deep learning methods rely upon huge amounts of labelled data, the critical problem of achieving a good classification accuracy when an extremely small amount of labelled data is available has yet to be tackled. In this work, we introduce a novel semi-supervised framework for X-ray classification which is based on a graph-based optimisation model. To the best of our knowledge, this is the first method that exploits graph-based semi-supervised learning for X-ray data classification. Furthermore, we introduce a new multi-class classification functional with carefully selected class priors which allows for a smooth solution that strengthens the synergy between the limited number of labels and the huge amount of unlabelled data. We demonstrate, through a set of numerical and visual experiments, that our method produces highly competitive results on the ChestX-ray14 data set whilst drastically reducing the need for annotated data.

研究の動機と目的

レントゲン画像分類における低品質で希少なラベル付き医療画像データの深刻な課題に対処する。
大規模で偏りのあるアノテーションデータセットを必要とする教師あり深層学習手法の限界を克服する。
膨大な量の未ラベル付きデータを効果的に活用し、極めて少ないラベル付きデータ下でも分類性能を向上させる半教師ありフレームワークを開発する。
グラフ上のラベル伝搬と解の滑らかさを向上させるために、データ統計から導出された特化されたクラス事前分布を備えた新しい多クラス分類汎関数を導入する。
グラフベースの半教師あり学習を胸郭レントゲン画像分類に初めて適用し、医療画像分野におけるその可能性を示す。

提案手法

画像がノードに該当する無向重み付きグラフとして、レントゲン画像データセットを表現する。エッジは特徴量の類似度で重み付けされる。
正規化された非滑らかさを持つp=1ラプラシアンを用いて、ロバストネスとスパarsityを確保するグラフ最適化問題として分類タスクを定式化する。
データ統計から導出されたクラス事前分布を有する、新たな多クラス分類汎関数を設計し、ラベル伝搬のガイドラインと解の滑らかさの向上を図る。
ラベル付きデータの制約を満たしながら、グラフベースのエネルギー汎関数を最小化するため、原双対アルゴリズムを用いて最適化問題を解く。
伝達学習を適用する：全ノード（ラベル付きおよび未ラベル付き）のラベルを、グラフ全体の構造を活用して同時に予測する。
グラフラプラシアンを用いて、隣接ノード間での予測の滑らかさを強制し、ノイズや誤ラベル付きの学習サンプルへの感受性を低減する。

実験結果

リサーチクエスチョン

RQ1グラフベースの半教師あり学習フレームワークは、著しく少ないラベル付きデータで、胸郭レントゲン画像分類において競争力のある精度を達成できるか？
RQ2最適化されたクラス事前分布を有する本手法は、標準的なグラフベース手法と比較して、ラベル伝搬と解の滑らかさをどのように向上させるか？
RQ3教師あり深層学習ベースラインと比較して、本フレームワークの性能は、データ分割やラベルセットの変動に対してどれほど頑健か？
RQ420%のラベル付きデータでの学習において、グラフベースの半教師あり学習が最先端の深層学習モデルを上回ることができるか？
RQ5正規化されたp=1ラプラシアンの使用は、従来のp=2形式と比較して、医療画像分類においてより安定的かつ正確な予測をもたらすか？

主な発見

GraphX${}^\text{NET}$は、ChestX-ray14データセットを用いて20%のラベル付きデータでのみ学習した場合、平均AUCが0.7888を達成し、Wangら（2017）やYaoら（2018）といった最先端の深層学習手法を上回った。
本手法は、異なるランダムなデータ分割に対して高い安定性を示し、AUCの変動が最小限に抑えられている。これに対して、教師ありベースラインは学習データの構成に極めて敏感である。
わずか5%のラベル付きデータでも、GraphX${}^\text{NET}$はAUC 0.58を達成したのに対し、Wangら（2017）の手法は70%のデータで学習した場合でもAUC 0.548にとどまった。
14の病態のうち10つで優れた性能を発揮し、特に肺炎（AUC 0.7664 vs. 0.658）や腫瘍（AUC 0.809 vs. 0.693）といった難易度の高いクラスで顕著な改善が見られた。
汎関数へのクラス事前分布の組み込みにより、ラベル伝搬が滑らかになり、特にデータが少ない状況下での一般化性能が向上した。
本手法は、グラフベースの半教師あり学習が、ラベル付きデータが限られる医療画像分類において、単なる可能性ではなく、実に効果的であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。