Skip to main content
QUICK REVIEW

[論文レビュー] Adaptive Context Selection for Polyp Segmentation

Ruifei Zhang, Guanbin Li|arXiv (Cornell University)|Jan 12, 2023
Radiomics and Machine Learning in Medical Imaging被引用数 12
ひとこと要約

本論文は、Local Context Attention (LCA)、Global Context Module (GCM)、Adaptive Selection Module (ASM) を用いたエンコーダ–デコーダフレームワークACSNetを提案し、局所と全体の文脈を適応的に融合してポリープセグメンテーションを行い、EndoSceneとKvasir-SEGデータセットで最先端の結果を達成する。

ABSTRACT

Accurate polyp segmentation is of great significance for the diagnosis and treatment of colorectal cancer. However, it has always been very challenging due to the diverse shape and size of polyp. In recent years, state-of-the-art methods have achieved significant breakthroughs in this task with the help of deep convolutional neural networks. However, few algorithms explicitly consider the impact of the size and shape of the polyp and the complex spatial context on the segmentation performance, which results in the algorithms still being powerless for complex samples. In fact, segmentation of polyps of different sizes relies on different local and global contextual information for regional contrast reasoning. To tackle these issues, we propose an adaptive context selection based encoder-decoder framework which is composed of Local Context Attention (LCA) module, Global Context Module (GCM) and Adaptive Selection Module (ASM). Specifically, LCA modules deliver local context features from encoder layers to decoder layers, enhancing the attention to the hard region which is determined by the prediction map of previous layer. GCM aims to further explore the global context features and send to the decoder layers. ASM is used for adaptive selection and aggregation of context features through channel-wise attention. Our proposed approach is evaluated on the EndoScene and Kvasir-SEG Datasets, and shows outstanding performance compared with other state-of-the-art methods. The code is available at https://github.com/ReaFly/ACSNet.

研究の動機と目的

  • ポリープのサイズと形状の多様性に対処することで正確なポリープセグメンテーションを動機付ける。
  • 局所および全体の文脈を選択的に活用するエンコーダ–デコーダフレームワークを開発する。
  • ポリープサイズに基づいて文脈特徴を適応的に融合するモジュール(LCA、GCM、ASM)を導入する。
  • 公開データセット(EndoScene、Kvasir-SEG)で評価し、最先端と比較して性能向上を示す。

提案手法

  • 五ブロックのResNet34エンコーダ/デコーダを備えたUNet様式のエンコーダ–デコーダを強化。
  • Local Context Attention (LCA) モジュールはスキップ接続の代わりに局所的なハード領域文脈を前回の予測マップに導かれてデコーダ機能を豊かにする。
  • Global Context Module (GCM) はプーリングブランチとノンローカル操作を通じて多スケールの全体文脈を捉え、すべてのASMブロックに文脈を供給。
  • Adaptive Selection Module (ASM) は絞り込みと強調のスタイルのチャンネル-wise注意を用いて局所と全体の文脈を前のデコーダ機能と融合。
  • 複数のデコーダ段階で予測マップを監督学習; 損失はバイナリ交差エントロピーとダイス損失を組み合わせ。

実験結果

リサーチクエスチョン

  • RQ1局所および全体の文脈の適応的な選択は、可変サイズ・形状のポリープに対してセグメンテーションを改善できるか?
  • RQ2LCA、GCM、ASM は個別および総合的にセグメンテーション精度にどう寄与するか?
  • RQ3ACSNet は標準ベンチマークで既存アーキテクチャより一貫して改善をもたらすか?

主な発見

MethodsRecSpecPrecDiceIoUpIoUbmIoUAcc
FCN8s60.2198.6079.5961.2348.3893.4570.9293.77
UNet85.5498.7583.5680.3170.6895.9083.2996.25
UNet++78.9099.1586.1777.3868.0095.4881.7495.78
SegNet86.4899.0486.5482.6774.4196.3385.3796.62
SFANet85.5198.9486.8182.9375.0096.3385.6696.61
Ours87.9699.1690.9986.5979.7396.8688.2997.11
  • ACSNetはEndoSceneでDiceスコア86.59%を達成し、列挙された方法の中で最高で、2番目に高いものより3.66%向上。
  • EndoSceneでは、ACSNetはRec 87.96、Spec 99.16、Prec 90.99、IoUp 79.73、IoUb 96.86、mIoU 88.29、Acc 97.11を達成。
  • Kvasir-SEGではACSNetがDice 91.30およびmIoU 90.28を達成し、UNet、UNet++、SFANet、SegNet系を上回る。Baseline+LCAs+GCMなどのアブレーションでも段階的な向上を示す。
  • アブレーション研究ではLCAs、GCM、およびASMを順次追加することでDiceがそれぞれ0.79%、1.28%、1.02%向上。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。