Skip to main content
QUICK REVIEW

[論文レビュー] Semi-Supervised Deep Learning for Abnormality Classification in Retinal Images

Bruno Lecouat, Ken Chang|arXiv (Cornell University)|Dec 19, 2018
Retinal Imaging and Analysis参考文献 10被引用数 30
ひとこと要約

本稿では、最小限のラベル付きデータを用いて高解像度の網膜画像における糖尿病性網膜症の分類を目的とした、パッチベースの半教師付きGANフレームワークを提案する。少数のラベル付きパッチで学習し、大規模なラベルなしデータセットを活用することで、30%未満のラベル付きデータで、教師ありベースラインに比べ最大15%高いAUCを達成するとともに、微小動脈瘤や出血などの微細な異常の局在化を解釈可能に可能にした。

ABSTRACT

Supervised deep learning algorithms have enabled significant performance gains in medical image classification tasks. But these methods rely on large labeled datasets that require resource-intensive expert annotation. Semi-supervised generative adversarial network (GAN) approaches offer a means to learn from limited labeled data alongside larger unlabeled datasets, but have not been applied to discern fine-scale, sparse or localized features that define medical abnormalities. To overcome these limitations, we propose a patch-based semi-supervised learning approach and evaluate performance on classification of diabetic retinopathy from funduscopic images. Our semi-supervised approach achieves high AUC with just 10-20 labeled training images, and outperforms the supervised baselines by upto 15% when less than 30% of the training dataset is labeled. Further, our method implicitly enables interpretation of the SSL predictions. As this approach enables good accuracy, resolution and interpretability with lower annotation burden, it sets the pathway for scalable applications of deep learning in clinical imaging.

研究の動機と目的

  • 網膜画像における微細な、希少な異常(微小動脈瘤など)の分類において、特に高コストなアノテーション負荷を軽減すること。
  • 従来の手法が解像度と局在化の両面で課題を抱えていた高解像度医療画像分野において、GANを用いた半教師付きディープラーニングを拡張すること。
  • パッチ単位での異常スコアの局在化により、予測の解釈可能性を高め、臨床的妥当性を確認可能にする。
  • 特に網膜画像分類において、ラベル付きデータが限られる状況で、半教師付き学習が教師あり学習を上回ることを示すこと。
  • 本手法が独立したデータセットや多様な臨床的画像応用分野へ一般化可能かどうかを検討すること。

提案手法

  • 高解像度の網膜フンダス画像を重複のないパッチに分割し、学習および推論に用いる。
  • 少数のラベル付きパッチと多数のラベルなしパッチを用いて、半教師付きGAN(SSL-GAN)を学習する。識別器は、本物/偽物分類とクラス分類の両方を実行する。
  • 損失関数は、ラベル付きパッチにおける教師あり交差エントロピー損失と、すべてのパッチにおける非教師ありGAN損失を組み合わせており、ドメイン間での特徴マッチングを可能にする。
  • パッチ単位の予測を統合して画像単位の分類スコアを生成することで、空間解像度と解釈可能性を保持する。
  • パッチ単位の異常スコアにガウスノイズを適用し、滑らかで視覚的に解釈可能な局在マップを生成し、元の画像に重ね合わせる。
  • 本フレームワークはIDRiDデータセットで評価され、一般化性の検証としてKaggle糖尿病性網膜症データセットでもテストされた。

実験結果

リサーチクエスチョン

  • RQ1半教師付きGANは、極めて少ないラベル付きパッチから学習しながらも、網膜異常の分類において高い性能を維持できるか?
  • RQ2パッチベースのアプローチは、高解像度医療画像におけるディープラーニングモデルの局在化精度と解釈可能性を向上させるか?
  • RQ3ラベル付きデータの増加に伴い性能はどのように変化するか?また、ラベル付きデータが限られる状況でSSLが教師あり学習を上回るか?
  • RQ4異なる分布や被験者特性を持つ独立したデータセットへ、モデルは一般化可能か?
  • RQ5パッチ単位の予測メカニズムは、臨床的に意味のあるモデル意思決定の解釈をどの程度可能にするか?

主な発見

  • SSL-GANは149枚の画像のうち20枚のラベル付き画像で学習した場合、AUC 85.1±2.6を達成し、ラベル付きデータが30%未満の状況で、教師ありベースラインに比べ最大15%高いAUCを示した。
  • パッチ単位では、10枚のラベル付き画像でAUC 84.5±11.5を達成し、最良の教師ありベースラインを10%以上上回った。
  • 正解のセグメンテーションマスクと比較したところ、CNNベースラインに比べ16.30%のAUC向上を示し、局在化精度の向上を確認した。
  • 独立したテストセット(Kaggle DRデータセット)では、SSL-GANがAUC 64%を達成したのに対し、教師ありCNNは47%にとどまり、強力な一般化能力を示した。
  • 画像単位の予測は、パッチ単位の予測に比べて約10%高いAUCを示し、局所的特徴の有効な統合が行われたことを示した。
  • モデルは臨床的に重要な特徴(例:漏出病変、出血)を正しく局在化したが、一部の周辺病変は見逃された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。