Skip to main content
QUICK REVIEW

[論文レビュー] Identifying Melanoma Images using EfficientNet Ensemble: Winning Solution to the SIIM-ISIC Melanoma Classification Challenge

Qishen Ha, Бо Лю|arXiv (Cornell University)|Oct 11, 2020
AI in cancer detection参考文献 5被引用数 46
ひとこと要約

論文は、主に EfficientNets を含む多様な CNN モデルの winning アンサンブル を提示し、画像とメタデータ入力を用い、安定した検証スキームとターゲット意識ラベリングを採用して SIIM-ISIC メラノーマ分類チャレンジで AUC のトップを達成。

ABSTRACT

We present our winning solution to the SIIM-ISIC Melanoma Classification Challenge. It is an ensemble of convolutions neural network (CNN) models with different backbones and input sizes, most of which are image-only models while a few of them used image-level and patient-level metadata. The keys to our winning are: (1) stable validation scheme (2) good choice of model target (3) carefully tuned pipeline and (4) ensembling with very diverse models. The winning submission scored 0.9600 AUC on cross validation and 0.9490 AUC on private leaderboard.

研究の動機と目的

  • 複数年にわたるデータを活用して positives 限定の皮膚画像からのメラノーマ分類の課題に対処する。
  • 不均衡データセットでモデル性能を信頼性高く推定するための安定した検証戦略を開発する。
  • メタデータの有無によるモデルアーキテクチャを検討し、アンサンブルの多様性と性能を向上させる。
  • 多様なバックボーンと入力サイズを組み合わせたアンサンブルを実証し、クロスバリデーションとプライベートリーダーボードでの AUC の最大化を図る。

提案手法

  • 多様なバックボーン(EfficientNet B3–B7、SE-ResNeXt-101、ResNeSt-101)を用いて複数の CNN モデルを訓練する。
  • 2019 の診断を 2020 のターゲットに対応付けることで得られる 9 クラスのターゲットを使用し、MEL を最終予測として AUC を評価する。
  • いくつかのモデルで 14 のメタデータ特徴を取り入れ、融合前に2つの FC 層を配置する。
  • 広範な画像拡張(Albumentations)とウォームリスタートを伴うコサインアニーリングを適用して、15エポックで訓練する。
  • 2018–2020 のデータを跨ぐ結合データの5分割 CV(cv_all)でモデルを評価し、健全性チェックのため cv_2020 を追跡する。
  • 確率を一様スコアに変換して平均化することで、18モデルの単純平均アンサンブルを作成する。

実験結果

リサーチクエスチョン

  • RQ1多様な CNN アーキテクチャのアンサンブルは、単一モデル手法より SIIM-ISIC メラノーマ分類で高い AUC を達成できるか?
  • RQ2画像データと同時にメタデータを組み込むことで、メラノーマ分類の性能とアンサンブルの多様性が向上するか?
  • RQ3複数年を跨ぐ結合バリデーション戦略は、不均衡な医用画像データに対してより安定で信頼性の高い性能推定を提供するか?

主な発見

ModelBackboneTargetInputResizeMetadataInit lrEpochscv_allcv_2020private_LBpublic_LB
1B39c768512yes3e-5180.97620.93000.93050.9182
2B49c7686403e-5150.97670.94000.92990.9342
3B49c7687683e-5150.97710.94080.92640.9251
4B49c768640yes3e-5150.97650.94080.93020.9221
5B49c10248962e-5150.97440.93900.93200.9281
6B49c5124483e-5150.97480.93070.92130.9002
7B59c512384yes3e-5150.97520.93290.91670.9350
8B59c7686401.5e-5150.97710.94280.92910.9216
9B54c7686401.5e-5150.97650.93840.93620.9260
10B59c5124483e-5150.97510.93970.93630.9387
11B69c7686403e-5150.97560.94440.94080.9283
12B69c7685763e-5150.97610.94430.92660.9245
13B69c5124483e-5150.97420.93830.92610.9154
14B79c512384yes3e-5150.97480.93940.91930.9170
15B79c7685761e-5150.97640.94320.92600.9271
16B79c7686401e-5150.97540.94400.93040.9115
17SE_X1019c7686403e-5150.97390.94280.92950.9337
18Nest1019c7686402e-5150.97280.93960.93200.9267
Ensemble-------0.98450.96000.94900.9442
  • 18-model アンサンブルは cv_all 0.9845、 cv_2020 0.9600、 private_LB 0.9490、 and public_LB 0.9442 を達成。
  • バックボーン、入力サイズ、メタデータの使用の多様性がアンサンブルの頑健性に寄与した。
  • 画像のみのモデルは通常、メタデータのみのモデルよりも性能が高いが、メタデータモデルは貴重な多様性を加えた。
  • 2018–2020 の結合トレーニングセットと cv_all ベースの検証を使用することで、2020 年データだけに依存するよりも安定した AUC 推定を得られた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。