Skip to main content
QUICK REVIEW

[論文レビュー] Image Data collection and implementation of deep learning-based model in detecting Monkeypox disease using modified VGG16

Md Manjurul Ahsan, Muhammad Ramiz Uddin|arXiv (Cornell University)|Jun 4, 2022
Poxvirus research and outbreaks被引用数 88
ひとこと要約

この論文は Monkeypox2022 画像データセットと皮膚画像から Monkeypox を検出する修正済み VGG16 モデルを提示し、二つの研究設定で評価し、LIME による解釈性を提供します。

ABSTRACT

While the world is still attempting to recover from the damage caused by the broad spread of COVID-19, the Monkeypox virus poses a new threat of becoming a global pandemic. Although the Monkeypox virus itself is not deadly and contagious as COVID-19, still every day, new patients case has been reported from many nations. Therefore, it will be no surprise if the world ever faces another global pandemic due to the lack of proper precautious steps. Recently, Machine learning (ML) has demonstrated huge potential in image-based diagnoses such as cancer detection, tumor cell identification, and COVID-19 patient detection. Therefore, a similar application can be adopted to diagnose the Monkeypox-related disease as it infected the human skin, which image can be acquired and further used in diagnosing the disease. Considering this opportunity, in this work, we introduce a newly developed "Monkeypox2022" dataset that is publicly available to use and can be obtained from our shared GitHub repository. The dataset is created by collecting images from multiple open-source and online portals that do not impose any restrictions on use, even for commercial purposes, hence giving a safer path to use and disseminate such data when constructing and deploying any type of ML model. Further, we propose and evaluate a modified VGG16 model, which includes two distinct studies: Study One and Two. Our exploratory computational results indicate that our suggested model can identify Monkeypox patients with an accuracy of $97\pm1.8\%$ (AUC=97.2) and $88\pm0.8\%$ (AUC=0.867) for Study One and Two, respectively. Additionally, we explain our model's prediction and feature extraction utilizing Local Interpretable Model-Agnostic Explanations (LIME) help to a deeper insight into specific features that characterize the onset of the Monkeypox virus.

研究の動機と目的

  • 公開ポータルから取得した Monkeypox 画像データセットを公開可能にし、ML 研究を可能にする。
  • Monkeypox と非 Monkeypox 画像を識別するよう、低度に修正された VGG16 転移学習モデルを開発する。
  • LIME を用いてモデル予測の解釈性を提供し、識別に寄与する画像領域を特定する。
  • 小〜中程度のデータで実現可能性を評価するため、二つのデータセット設定でモデル性能を評価する。
  • 限界を強調し、今後のデータ収集とモデル展開の方向性を提供する。

提案手法

  • Monkeypox2022 データセットを、Monkeypox、Chickenpox、Measles、Normal skin 画像を含むオープンソース画像から組み立てる;Keras ImageDataGenerator を用いて回転、シフト、ズーム、シェア、反転、反射充填によるデータ拡張を行う。
  • 更新された層を追加した修正版 VGG16 アーキテクチャを実装し、二値分類(Monkeypox vs Others)用の密結合/ドロップアウトブロックを追加。
  • グリッドサーチで二つの研究のハイパーパラメータを調整; Study One は小さいバッチとエポック、 Study Two はより大きいバッチとエポック、Adam 最適化を使用。
  • Local Interpretable Model-Agnostic Explanations (LIME) を適用して画像レベルの説明を生成し、予測に寄与する顕著な領域を特定。
  • accuracy, precision, recall, F1-score, sensitivity, specificity, AUC で性能を評価し、小規模なサンプルサイズのため 95% 信頼区間で結果を報告。
  • Datasets は 80/20 で train/test に分割。Study One: Monkeypox 43 total (train 34, test 9) and Others 47 total (train 38, test 9); Study Two: Monkeypox augmented 587 (train 470, test 117) and Others 1167 (train 933, test 234).

実験結果

リサーチクエスチョン

  • RQ1公開可能な Monkeypox 画像データセットは、皮膚画像からの Monkeypox の効果的な ML ベース検出を可能にするか?
  • RQ2修正済み VGG16 モデルは、小〜中規模データセットで Monkeypox と非 Monkeypox 画像を区別する性能においてどうか?
  • RQ3データ拡張を用いた転移学習アプローチは、初期の Monkeypox 画像分類研究で信頼できる性能を示すか?
  • RQ4LIME の説明は解剖学的に妥当な領域を明らかにし、モデルの解釈性をサポートするか?
  • RQ5実時間スクリーニングやモバイルツールへのデプロイを検討する際の制限と実務的考慮事項は何か?

主な発見

研究データセット精度適合率再現率F1スコア感度特異度
Study OneTrain set0.97 ± 0.0180.97 ± 0.0180.97 ± 0.0180.97 ± 0.0180.973 ± 0.0170.97 ± 0.018
Study OneTest set0.83 ± 0.0850.88 ± 0.0720.83 ± 0.0850.83 ± 0.8510.66 ± 0.12
Study TwoTrain set0.88 ± 0.0080.86 ± 0.0090.87 ± 0.0080.86 ± 0.0090.83 ± 0.0100.89 ± 0.008
Study TwoTest set0.78 ± 0.0220.75 ± 0.0230.75 ± 0.0230.75 ± 0.0230.65 ± 0.0280.83 ± 0.019
  • Study One は高い学習精度 (0.97) と強い AUC (0.972) を達成したが、テスト性能は低く (accuracy 0.83, AUC 0.972 0.748 for ROC curves reported)。
  • Study Two はデータセットの不均衡により全体的な性能が低く(Monkeypox vs Others)、訓練精度 0.88、テスト精度 0.78、テストセットの AUC 0.748。
  • LIME の可視化は予測を導く領域を強調し、誤分類の解釈に役立った(例:Study One は非症状領域に焦点を当てたため Monkeypox を Chickenpox と誤分類)。
  • 修正済み VGG16 を用いた転移学習は、小〜中規模データセットで 78%–97% の accuracy を達成でき、データが限られた場合でも画像ベースの Monkeypox スクリーニングが実現可能であることを示唆。
  • 著者らは、データ収集が大幅に拡大する際に研究を促進し比較できるよう、公開可能な Monkeypox データセットを提供する。
  • 本研究は解釈性(LIME)を臨床試験準備と潜在的なリアルタイムスクリーニングアプリケーションの要件として強調している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。