Skip to main content
QUICK REVIEW

[論文レビュー] Evaluation of Deep Segmentation Models for the Extraction of Retinal Lesions from Multi-modal Retinal Images

Taimur Hassan, Muhammad Usman Akram|arXiv (Cornell University)|Jun 4, 2020
Retinal Imaging and Analysis参考文献 20被引用数 4
ひとこと要約

本研究では、マルチモodalなフンダスおよびOCT画像から網膜病変を抽出するための6つのディープセグメンテーションモデル—RAGNet、PSPNet、SegNet、UNet、FCN-8、およびFCN-32—を評価した。RAGNetは平均Dice係数(D_C = 0.822)が最高を記録し、ドリューゼンに対してはUNetが最も優れた性能(D_C = 0.864)を示した。これは、病変タイプや画像モodalitiyに応じてモデルの性能が異なることを示している。

ABSTRACT

Identification of lesions plays a vital role in the accurate classification of retinal diseases and in helping clinicians analyzing the disease severity. In this paper, we present a detailed evaluation of RAGNet, PSPNet, SegNet, UNet, FCN-8 and FCN-32 for the extraction of retinal lesions such as intra-retinal fluid, sub-retinal fluid, hard exudates, drusen, and other chorioretinal anomalies from retinal fundus and OCT scans. We also discuss the transferability of these models for extracting retinal lesions by varying training-testing dataset pairs. A total of 363 fundus and 173,915 OCT scans were considered in this evaluation from seven publicly available datasets from which 297 fundus and 59,593 OCT scans were used for testing purposes. Overall, the best performance is achieved by RAGNet with a mean dice coefficient ($\mathrm{D_C}$) score of 0.822 for extracting retinal lesions. The second-best performance is achieved by PSPNet (mean $\mathrm{D_C}$: 0.785) using ResNet extsubscript{50} as a backbone. Moreover, the best performance for extracting drusen is achieved by UNet ($\mathrm{D_C}$: 0.864). The source code is available at: this http URL.

研究の動機と目的

  • マルチモダリティ網膜画像データからの多様な網膜病変をセグメンテーションする複数のディープラーニングアーキテクチャの性能を評価すること。
  • 訓練済みモデルの異なるフンダスおよびOCTデータセット間での転送可能性を調査すること。
  • ドリューゼン、ハードエキスダート、および液体蓄積などの特定の病変タイプに対して最も効果的なモデルアーキテクチャを同定すること。
  • 網膜病変セグメンテーションのための大規模な公開データセットを用いた包括的なベンチマークを提供すること。

提案手法

  • 本研究では、7つの公開データセットから得た合計363枚のフンダス画像および173,915枚のOCTスキャンを用いて、RAGNet、PSPNet、SegNet、UNet、FCN-8、およびFCN-32を評価した。
  • トレーニングとテストには297枚のフンダスおよび59,593枚のOCTスキャンを用い、性能はDice係数(D_C)で測定した。
  • モデルの汎化性能を評価するために、トレーニングおよびテスト用データセットの組み合わせを変化させ、転送可能性を分析した。
  • PSPNetにはResNet-50をバックボーンとして使用したが、他のモデルはアーキテクチャの変更なしに標準的なアーキテクチャを使用した。
  • すべてのモデルは、交差エントロピー損失とデータオーグメンテーションを用いた標準的なディープラーニングパイプラインでトレーニングおよび評価した。
  • ソースコードは公開され、再現性およびさらなるベンチマーク作成を支援する。

実験結果

リサーチクエスチョン

  • RQ1マルチモダリティ網膜画像において、網膜病変をセグメンテーションする際、どのディープセグメンテーションモデルが最も高い総合的性能を示すか?
  • RQ2異なるフンダスおよびOCTデータセット間でのモデルの性能は、どのように変化するか?
  • RQ3ドリューゼン、網膜内液性浮腫、またはハードエキスダートなどの特定の病変タイプに対して、どのモデルが最も優れた性能を示すか?
  • RQ4モデルアーキテクチャの選択が、網膜画像における病変セグメンテーションの正確性に与える影響は何か?

主な発見

  • RAGNetは、全病変タイプにおいて最高の平均Dice係数(D_C = 0.822)を達成し、他のすべてのモデルを上回った。
  • ResNet-50をバックボーンとするPSPNetは、平均D_Cが0.785で2番目に高く、病変タイプ全体にわたる汎化性能が優れていた。
  • UNetはドリューゼンセグメンテーションにおいて最良の性能を示し、D_Cが0.864で、他のモデルを著しく上回った。
  • 本研究では、病変タイプによってモデルの性能が顕著に異なることが示され、すべての病変カテゴリに対して最適なモデルは存在しないことがわかった。
  • データ分布の違いが顕著に異なる場合、トレーニングとテストのデータセット間での性能低下が観察されたが、データセット間での転送可能性は確認された。
  • 結果として、網膜病変セグメンテーションの包括的ベンチマークが確立され、病変の種類に応じたアーキテクチャ固有の強みが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。