Skip to main content
QUICK REVIEW

[論文レビュー] Unsupervised and semi-supervised learning with Categorical Generative Adversarial Networks assisted by Wasserstein distance for dermoscopy image Classification

Yi Xin, Ekta Walia|arXiv (Cornell University)|Apr 10, 2018
Cutaneous Melanoma Detection and Management参考文献 27被引用数 41
ひとこと要約

本論文は、Wasserstein距離を組み込んだカテゴリー型GANであるcatWGANを提案し、無監視および半監視設定で皮膚検査用ダーモスコピー特徴を学習、ラベルが限られた場合でもメラノーマ分類で競争力を持ち、現実的なダーモスコピー画像を生成する。

ABSTRACT

Melanoma is a curable aggressive skin cancer if detected early. Typically, the diagnosis involves initial screening with subsequent biopsy and histopathological examination if necessary. Computer aided diagnosis offers an objective score that is independent of clinical experience and the potential to lower the workload of a dermatologist. In the recent past, success of deep learning algorithms in the field of general computer vision has motivated successful application of supervised deep learning methods in computer aided melanoma recognition. However, large quantities of labeled images are required to make further improvements on the supervised method. A good annotation generally requires clinical and histological confirmation, which requires significant effort. In an attempt to alleviate this constraint, we propose to use categorical generative adversarial network to automatically learn the feature representation of dermoscopy images in an unsupervised and semi-supervised manner. Thorough experiments on ISIC 2016 skin lesion chal- lenge demonstrate that the proposed feature learning method has achieved an average precision score of 0.424 with only 140 labeled images. Moreover, the proposed method is also capable of generating real-world like dermoscopy images.

研究の動機と目的

  • 皮膚科医の作業負荷を低減し、ラベル付きデータへの依存を減らすため、ダーモスコピー画像を用いた自動メラノーマスクリーニングを動機づける。
  • catGANを介してラベルなしのダーモスコピー画像を活用する特徴学習フレームワークを開発し、安定性のためにWasserstein距離で改善する。
  • ISIC 2016データで限られたラベルデータを用いた分類性能を評価し、ベースラインと比較する。
  • データ拡張のために実世界に近いダーモスコピー画像を合成する能力を示す。

提案手法

  • 訓練を安定化させ、生成器の勾配を改善するために、2つ目のWassersteinベースの識別器 (D2) を備えたcatGANを適用する。
  • D1が悪性黒ほう? melanoma vs benignのクラス信頼度を出力する2識別器構成を用い、D2が実データと生成データ間のWasserstein距離を課す。
  • catGAN損失とWGAN勾配ペナルティ損失の組み合わせで学習し、半監視モードではラベル付きデータに対するクロスエントロピーを任意で併用する。
  • D1の学習済み特徴量(最後から3番目の層)を線形SVM評価用に抽出し、訓練中の特徴の進化を追跡する。
  • 実データの病変領域を分割して切り出し、ネットワーク入力のために64x64(分析の一部では128x128)にリサイズする。
  • アーキテクチャ: DCGAN風の改良を加えたカスタムcatGANのGとD1;D2は高周波の局所パッチに焦点を当てた3層の全結合畳み込みネットワーク。Adam学習率 lr=0.0002で最適化。
  • 訓練詳細: 無監視には20kのラベルなしサンプル、半監視には各クラス70ラベル(10kに拡張); バッチサイズ200; lambda=10, alpha=0.1; 16k反復。

実験結果

リサーチクエスチョン

  • RQ1ラベル付きデータが限られている状況で、catGANを用いた無監督・半監督学習はダーモスコピー画像から識別可能なメラノーマ特徴を学習できるか?
  • RQ2Wasserstein距離を第2の識別器として統合することは訓練を安定させ、メラノーマ分類の特徴品質を改善するか?
  • RQ3catWGANの学習特徴表現はISIC 2016における従来の手作り特徴量やノイズ除去オートエンコーダと比較してどうか?
  • RQ4生成器はデータ拡張に適した現実的なダーモスコピー画像を生成できるか?

主な発見

方法APAUCAC
catWGAN-unsuper (proposed)0.3510.6130.812
catWGAN-semi (proposed)0.4240.6900.810
Edge Histogram0.2650.5710.665
Color Histogram0.3600.6260.789
DAE0.3290.6340.794
  • 無監督catWGANはISICテストでAP 0.351、AUC 0.613、AC 0.812を達成し、ベースラインと比較。
  • 半監督catWGANは性能を著しく向上させ、ISICテストでAP 0.424、AUC 0.690、AC 0.810。
  • 比較ベースライン: Edge Histogram (AP 0.265, AUC 0.571, AC 0.665)、Color Histogram (AP 0.360, AUC 0.626, AC 0.789)、DAE (AP 0.329, AUC 0.634, AC 0.794)。
  • 64x64のダーモスコピー画像(図では128x128)を生成し、実世界に近いサンプルを示す(図9)。
  • 特徴量の進化は、無監督・半監督の訓練の初期反復でAC/AUCの改善を示し、APは飽和する。
  • 半監督catWGANは報告されたISIC 2016テストセットの指標で無監督版およびベースラインを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。