[論文レビュー] WonDerM: Skin Lesion Classification with Fine-tuned Neural Networks
WonDerMは、分類タスクで事前学習された分割モデルに基づく微調整済みDenseNetアーキテクチャとアンサンブル学習を用いて、クラス不均衡を是正するための深層学習パイプラインを提案する。この手法はISIC 2018チャレンジにおいて検証セットで89.9%の精度、テストセットで78.5%の精度を達成し、トランスファーラーニングと重み付きアンサンブルスコアリングによって性能が向上していることを示している。
As skin cancer is one of the most frequent cancers globally, accurate, non-invasive dermoscopy-based diagnosis becomes essential and promising. A task of the Part 3 of the ISIC Skin Image Analysis Challenge at MICCAI 2018 is to predict seven disease classes with skin lesion images, including melanoma (MEL), melanocytic nevus (NV), basal cell carcinoma (BCC), actinic keratosis / Bowen's disease (intraepithelial carcinoma) (AKIEC), benign keratosis (solar lentigo / seborrheic keratosis / lichen planus-like keratosis) (BKL), dermatofibroma (DF) and vascular lesion (VASC) as defined by the International Dermatology Society. In this work, we design the WonDerM pipeline, that resamples the preprocessed skin lesion images, builds neural network architecture fine-tuned with segmentation task data (the Part 1), and uses an ensemble method to classify the seven skin diseases. Our model achieved an accuracy of 0.899 and 0.785 in the validation set and test set, respectively.
研究の動機と目的
- 皮膚腫瘍の多クラス分類におけるクラス不均衡の課題に対処すること。
- 分類タスクからのトランスファーラーニングを用いて、メラノーマや良性病変を含む7つの皮膚疾患クラスの分類性能を向上させること。
- 複数の分類器を重み付き確率スコアリングで統合する、信頼性の高い予測を実現する頑健なアンサンブルモデルを開発すること。
- 分割データから学習された形態的および空間的特徴を活用し、分類における一般化性能を向上させること。
提案手法
- パイプラインは、2,594枚の画像を用いて皮膚腫瘍の分割を実行する事前学習済みDenseNet-U-Netアーキテクチャを用い、高レベル特徴を抽出する。
- 分割モデルのエンコーダ部は、HAM10000データセットから再サンプリングされた28,052枚のバランス化済み訓練データ上で微調整される。
- 4つの異なるバランス化済みデータセットを用いて、4つの独立した分類モデルが学習される。各データセットは少数クラスのサイズに合わせて調整されている(例:BCCは約463枚)。
- 重み付きアンサンブル手法により、モデルの信頼性の不均衡を是正するため、クラス固有の真正陽性率を重みとして使用する。
- 最終的な予測は、重み付き確率スコアが最大となるクラスを選択することで行われる:$\tilde{P}_{ij\cdot} = \frac{\sum_{\forall k} w_k^{(j)} P_{ijk}}{\sum_{\forall j} \sum_{\forall k} w_k^{(j)} P_{ijk}}$、ここで$w_k^{(j)}$はネットワーク$k$におけるクラス$j$の真正陽性率を表す。
- データ拡張には、回転(90°, 180°, 270°)、垂直反転、水平反転が、少数クラス(DF, VASC)に対して適用される。
実験結果
リサーチクエスチョン
- RQ1分類タスクからの分割タスクへのトランスファーラーニングは、多クラス皮膚腫瘍診断における分類性能を向上させることができるか?
- RQ2重み付き確率スコアリングを用いたアンサンブル学習は、皮膚腫瘍分類におけるクラス不均衡を効果的に是正できるか?
- RQ3少数クラスの頻度を目標として訓練データを再サンプリングすることで、すべてのクラスにおけるモデルの一般化性能が向上するか?
- RQ4ハイブリッドDenseNet-U-Netアーキテクチャは、分割と分類の両方で有用な形態的特徴を効果的に抽出できるか?
主な発見
- アンサンブルモデルは検証セットで89.9%の精度を達成し、個々のモデルを著しく上回った。
- テストセットでは78.5%の精度に達し、未学習データに対する強い一般化性能を示した。
- 重み付きアンサンブルスコアリング手法により、多数クラスへのバイアスが是正され、少数クラスで高い真正陽性率を示すモデルに高い重みが割り当てられた。
- 分割タスクで事前学習された特徴の活用により、皮膚腫瘍の複雑な形態的パターンの特徴学習が向上した。
- 少数クラスの頻度(例:1クラスあたり463枚)を目標として訓練データを再サンプリングすることで、DF や VASC などの少数クラスにおけるモデル性能が顕著に向上した。
- 混同行列の分析から、7つのすべてのクラスで一貫した性能が得られ、NV(母斑)で最も高い精度を示し、MEL や BCC についても中程度から高い精度を達成した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。