Skip to main content
QUICK REVIEW

[論文レビュー] SLSNet: Skin lesion segmentation using a lightweight generative adversarial network

Md. Mostafa Kamal Sarker, Hatem A. Rashwan|arXiv (Cornell University)|Jul 1, 2019
Cutaneous Melanoma Detection and Management参考文献 65被引用数 60
ひとこと要約

SLSNet は、1-D カーネル分解、位置とチャネルの注意、およびマルチスケール集約を用いた軽量 GAN ベースの皮膚病変セグメンテーションモデルを提案し、低資源使用で競合的な精度を達成し、GTX1080Ti 上で 97.61% の精度と >110 FPS を実現、パラメータは 2.35M。

ABSTRACT

The determination of precise skin lesion boundaries in dermoscopic images using automated methods faces many challenges, most importantly, the presence of hair, inconspicuous lesion edges and low contrast in dermoscopic images, and variability in the color, texture and shapes of skin lesions. Existing deep learning-based skin lesion segmentation algorithms are expensive in terms of computational time and memory. Consequently, running such segmentation algorithms requires a powerful GPU and high bandwidth memory, which are not available in dermoscopy devices. Thus, this article aims to achieve precise skin lesion segmentation with minimum resources: a lightweight, efficient generative adversarial network (GAN) model called SLSNet, which combines 1-D kernel factorized networks, position and channel attention, and multiscale aggregation mechanisms with a GAN model. The 1-D kernel factorized network reduces the computational cost of 2D filtering. The position and channel attention modules enhance the discriminative ability between the lesion and non-lesion feature representations in spatial and channel dimensions, respectively. A multiscale block is also used to aggregate the coarse-to-fine features of input skin images and reduce the effect of the artifacts. SLSNet is evaluated on two publicly available datasets: ISBI 2017 and the ISIC 2018. Although SLSNet has only 2.35 million parameters, the experimental results demonstrate that it achieves segmentation results on a par with the state-of-the-art skin lesion segmentation methods with an accuracy of 97.61%, and Dice and Jaccard similarity coefficients of 90.63% and 81.98%, respectively. SLSNet can run at more than 110 frames per second (FPS) in a single GTX1080Ti GPU, which is faster than well-known deep learning-based image segmentation models, such as FCN. Therefore, SLSNet can be used for practical dermoscopic applications.

研究の動機と目的

  • 限られた計算資源とメモリ資源の下で、皮膚病変の正確なセグメンテーションのニーズに対応する。
  • 軽量で自動的なセグメンテーションモデルを開発し、最先端手法と競える性能を発揮する。
  • 毛髪、低コントラスト、境界の曖昧さに対処するため、マルチスケール機能集約と注意機構を組み込む。
  • 実際の dermoscopy デバイスおよび組み込みシステムでのモデルの実用性を示す。

提案手法

  • lesion segmentation のための generator G と discriminator D を用いた GAN ベースのフレームワーク(pix2pix)を使用する。
  • Scale に不変な特徴を構築するため、1/8、1/4、1/2 にスケールした画像を処理するマルチスケールエンコーダを組み込む。
  • Discriminative な特徴表現を強化するため、CAM(Channel Attention Module)と PAM(Position Attention Module)を適用する。
  • 計算コストを削減しつつ表現力を保つため、1-D カーネル因子分解(FCM)モジュールを導入し、その後 CAM を適用する。
  • バイナリクロスエントロピー、L1、Jaccard ロスを組み合わせたジョイントロスを用いて境界精度と IoU 指標を向上させる。
  • Adam 最適化と PSP ベースのしきい値を用いたデータ拡張を ISBI 2017 および ISIC 2018 データセットで行い、マスク変換を実施する。

実験結果

リサーチクエスチョン

  • RQ1軽量 GAN ベースのモデルは ISBI 2017 および ISIC 2018 データセットで最先端手法と競合するセグメンテーション精度を達成できるか。
  • RQ2マルチスケール集約と位置・チャネル注意を組み合わせると、毛髪・低コントラスト・可変病変形状がある場合のセグメンテーションは改善されるか。
  • RQ3提案する 1-D カーネル因子分解ネットワークはパラメータ数と計算量を実用レベルまで削減し、標準的な GPU でリアルタイムに動作できるか。
  • RQ4BCE、L1、Jaccard ロスの組み合わせが境界精度と IoU 指標に与える影響は何か。

主な発見

  • 評価データセットで 97.61% の精度を達成。
  • Dice 相似係数 90.63%、Jaccard 相似係数 81.98% を得る。
  • パラメータはわずか 2.35 百万で、GTX1080Ti 上の推論を高速化(約 >110 FPS )可能。
  • 最先端手法に匹敵する分割結果を提供しつつ、計算資源を大幅に削減。
  • 実用的な dermoscopic デバイスに適したリアルタイム適用性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。