[論文レビュー] Semi-supervised Skin Lesion Segmentation via Transformation Consistent Self-ensembling Model
本論文では、ラベルなしの皮膚腫瘍画像を活用して、最小限のラベル付きデータで性能を向上させる変換一貫性を持つ自己アンサンブルモデルを用いた半教師あり皮膚腫瘍分類手法を提案する。回転や反転などのデータオーキュメーションに対して一貫した予測を強制することで、ISIC 2017ベンチマークでたった300枚のラベル付きサンプルを用いて最先端の性能を達成し、2,000枚のラベル付きデータで訓練された完全教師ありモデルを上回った。
Automatic skin lesion segmentation on dermoscopic images is an essential component in computer-aided diagnosis of melanoma. Recently, many fully supervised deep learning based methods have been proposed for automatic skin lesion segmentation. However, these approaches require massive pixel-wise annotation from experienced dermatologists, which is very costly and time-consuming. In this paper, we present a novel semi-supervised method for skin lesion segmentation by leveraging both labeled and unlabeled data. The network is optimized by the weighted combination of a common supervised loss for labeled inputs only and a regularization loss for both labeled and unlabeled data. In this paper, we present a novel semi-supervised method for skin lesion segmentation, where the network is optimized by the weighted combination of a common supervised loss for labeled inputs only and a regularization loss for both labeled and unlabeled data. Our method encourages a consistent prediction for unlabeled images using the outputs of the network-in-training under different regularizations, so that it can utilize the unlabeled data. To utilize the unlabeled data, our method encourages the consistent predictions of the network-in-training for the same input under different regularizations. Aiming for the semi-supervised segmentation problem, we enhance the effect of regularization for pixel-level predictions by introducing a transformation, including rotation and flipping, consistent scheme in our self-ensembling model. With only 300 labeled training samples, our method sets a new record on the benchmark of the International Skin Imaging Collaboration (ISIC) 2017 skin lesion segmentation challenge. Such a result clearly surpasses fully-supervised state-of-the-arts that are trained with 2000 labeled data.
研究の動機と目的
- 皮膚科的レーザー画像におけるピクセル単位の分類の高コストなアノテーションを軽減するため、大規模なラベル付きデータセットへの依存を減らす。
- 臨床的皮膚科的レーザー画像に一般的に見られる曖昧またはノイズの混入したアノテーションに対してモデルのロバスト性を向上させる。
- 自己アンサンブルを用いて、ラベルなし皮膚科的レーザー画像を効果的に活用することで、深層ニューラルネットワークの特徴学習を強化する。
- 医用画像のピクセルレベル分類タスクに特化した変換一貫性正則化スキームを開発する。
提案手法
- ラベル付きデータの教師あり損失と、ラベル付きおよびラベルなしデータの両方における教師なし正則化損失の重み付き組み合わせを用いて深層ニューラルネットワークを訓練する。
- 回転や反転などの異なるデータオーキュメーションに対して予測の一貫性を強制し、変換された入力の予測の差を最小化することで実現する。
- 入力画像と同じように予測が変換されるように保証する変換一貫性スキームを導入し、空間的整合性を維持する。
- 同じ画像が異なるオーキュメーションを受ける場合に一貫した出力を生成するようモデルを励ますことで、自己アンサンブルを適用し、正則化として機能させる。
- 一般化およびロバスト性を向上させるために、教師なし損失の一部としてデータオーキュメーション(例:ランダム回転、反転)を活用する。
- アノテーションが曖昧な場合でも、一貫性損失を用いて予測を正則化することで、ノイズの多いラベルに対する耐性を高める。
実験結果
リサーチクエスチョン
- RQ1変換一貫性を持つ自己アンサンブルフレームワークは、限られたラベル付きデータで半教師あり皮膚腫瘍分類の性能を向上させることができるか?
- RQ2変換一貫性(例:回転、反転)は、医用画像分類のピクセルレベル予測に対する正則化としてどの程度効果的か?
- RQ3ラベルなし皮膚科的レーザー画像は、モデルの一般化性能および曖昧なアノテーションへの耐性をどの程度向上させられるか?
- RQ4提案手法は、顕著に少ないラベル付きサンプルで訓練された場合、完全教師ありSOTAモデルを上回るか?
主な発見
- 提案された半教師あり手法は、ISIC 2017テストセットでたった300枚のラベル付き画像を用いて、Jaccard Index (JA) 79.8%を達成し、2,000枚のラベル付きデータで訓練された完全教師ありSOTA手法(76.5%)を上回った。
- 50枚のラベル付きおよび1,950枚のラベルなし画像を用いた場合、JAが2.46%向上した。これは、先行する半教師あり手法(Bai et al.およびHung et al.)がそれぞれ1.55%および0.87%の向上にとどまったのと比較して顕著な改善であった。
- 教師なし損失が強力な正則化を提供しており、2,000枚すべての画像を使用した場合でもJAが79.60%から80.02%に上昇した。これは、ラベルノイズに対する耐性が向上したことを示している。
- モデルはDI(Dice)、SE(感受性)、SP(特異性)においても優れた性能を示し、SOTAベースライン比でそれぞれ2.5%、5.4%、1.6%の向上を達成した。
- 変換一貫性のある自己アンサンブルスキームにより、曖昧なラベルへの感受性が著しく低減されたことが、困難なケースにおいて一貫した性能向上の証明として示された。
- 異なるデータ分割に対して良好に一般化され、複数の評価指標において一貫した向上を示しており、本手法のロバスト性およびスケーラビリティが確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。