[論文レビュー] Transfer learning with class-weighted and focal loss function for automatic skin cancer classification
この論文は transfer learning、class-weighted loss、 focal loss を用いて訓練した modified ResNet50 モデルの ensemble を用いて HAM10000 skin lesion images を seven categories に分類し、cross-validation で 93% top accuracy、test set で 90% を達成している。
Skin cancer is by far in top-3 of the world's most common cancer. Among different skin cancer types, melanoma is particularly dangerous because of its ability to metastasize. Early detection is the key to success in skin cancer treatment. However, skin cancer diagnosis is still a challenge, even for experienced dermatologists, due to strong resemblances between benign and malignant lesions. To aid dermatologists in skin cancer diagnosis, we developed a deep learning system that can effectively and automatically classify skin lesions into one of the seven classes: (1) Actinic Keratoses, (2) Basal Cell Carcinoma, (3) Benign Keratosis, (4) Dermatofibroma, (5) Melanocytic nevi, (6) Melanoma, (7) Vascular Skin Lesion. The HAM10000 dataset was used to train the system. An end-to-end deep learning process, transfer learning technique, utilizing multiple pre-trained models, combining with class-weighted and focal loss were applied for the classification process. The result was that our ensemble of modified ResNet50 models can classify skin lesions into one of the seven classes with top-1, top-2 and top-3 accuracy 93%, 97% and 99%, respectively. This deep learning system can potentially be integrated into computer-aided diagnosis systems that support dermatologists in skin cancer diagnosis.
研究の動機と目的
- Automatic で正確な seven-class skin lesion classification を dermatologists の支援のため動機づける。
- Imbalanced な skin lesion データを扱うため pre-trained CNNs を用いた transfer learning を活用する。
- minority クラスの性能を改善するため class weighting と focal loss を導入する。
- 特徴量エンジニアリングを最小限に抑えた end-to-end パイプラインを開発し、堅牢な診断を実現する。
提案手法
- ImageNet で pre-trained された ResNet50 アーキテクチャを global average pooling、dropout、2 層の dense を用いてわずかに改良する。
- imbalance に対処するため class ratios に基づく loss を適用する。
- hard な例に訓練を焦点化し easy negatives の影響を減らすため focal loss を組み込む。
- 訓練データを増強する(回転、反転、cutout、クロップ)、 stratified sampling と 5-fold cross-validation を使用する。
- 複数のモデルを ensemble し、最終予測に test-time augmentation (TTA) を適用する。
実験結果
リサーチクエスチョン
- RQ1ResNet50 を用いた transfer learning と class-weighted 及び focal loss で HAM10000 における多クラス皮膚病変分類の高精度を達成できるか。
- RQ2降下 (dropout)、増強、CW loss、focal loss、GAP が分類性能に及ぼす影響はどれか。
- RQ3ResNet50、VGG16、MobileNet、EfficientNetB1 の中で、精度とデプロイ可能性のバランスが最も良い base アーキテクチャはどれか。
- RQ4TTA を含む ensemble は folds やデータセット全体で一般化を改善するか。
- RQ5提案手法は accuracy および class-wise performance の点で既存の HAM10000 研究と比較してどうか。
主な発見
| Experiment | Accuracy | Precision | Recall | F1-score |
|---|---|---|---|---|
| 1 (no dropout) | 90 | 78 | 77 | 77 |
| 2 (no augment) | 89 | 79 | 71 | 74 |
| 3 (no CW) | 90 | 81 | 77 | 79 |
| 4 (no FC) | 74 | 70 | 80 | 72 |
| 5 (no GAP) | 88 | 77 | 73 | 75 |
| 6 (full) | 90 | 81 | 80 | 80 |
- 改良された ResNet50 モデルの ensemble はすべての技術を組み合わせた場合、5-fold cross-validation 全体で 93% の accuracy、test set で 90% の accuracy を達成する。
- 完全な手法( dropout、augmentation、class-weighted loss、focal loss、global average pooling )は、acccuracy、precision、recall、F1-score の各指標で ablations を上回る。
- クラス別の precision、recall、F1-score はいくつかのクラスで強い性能を示し、平均指標は前例のある研究に対して競争力のある結果を示す。
- ResNet50 は stage-1 の実験で VGG16、MobileNet、EfficientNetB1 を上回ったが、EfficientNetB1 はモバイル展開のトレードオフを提供する。
- GradCAM の可視化はモデルが病変領域に focus していることを示す一方、アーティファクトへの誤フォーカスもあり、性能を改善しなかった segmentation ベースの分析を促す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。