Skip to main content
QUICK REVIEW

[論文レビュー] FCB-SwinV2 Transformer for Polyp Segmentation

Kerr Fitzgerald, B.K. Matuszewski|arXiv (Cornell University)|Feb 2, 2023
Colorectal Cancer Screening and Detection被引用数 12
ひとこと要約

この論文は FCBFormer を置換して its transformer を SwinV2 Transformer-UNET に置換し、わずかな FCN の調整を行うことで、Kvasir-SEG および CVC-ClinicDB でポリプセグメンテーションの最先端を達成し、mDice スコアの改善とデータ分割の問題を強調している。

ABSTRACT

Polyp segmentation within colonoscopy video frames using deep learning models has the potential to automate the workflow of clinicians. This could help improve the early detection rate and characterization of polyps which could progress to colorectal cancer. Recent state-of-the-art deep learning polyp segmentation models have combined the outputs of Fully Convolutional Network architectures and Transformer Network architectures which work in parallel. In this paper we propose modifications to the current state-of-the-art polyp segmentation model FCBFormer. The transformer architecture of the FCBFormer is replaced with a SwinV2 Transformer-UNET and minor changes to the Fully Convolutional Network architecture are made to create the FCB-SwinV2 Transformer. The performance of the FCB-SwinV2 Transformer is evaluated on the popular colonoscopy segmentation bench-marking datasets Kvasir-SEG and CVC-ClinicDB. Generalizability tests are also conducted. The FCB-SwinV2 Transformer is able to consistently achieve higher mDice scores across all tests conducted and therefore represents new state-of-the-art performance. Issues found with how colonoscopy segmentation model performance is evaluated within literature are also re-ported and discussed. One of the most important issues identified is that when evaluating performance on the CVC-ClinicDB dataset it would be preferable to ensure no data leakage from video sequences occurs during the training/validation/test data partition.

研究の動機と目的

  • 自動化されたポリプセグメンテーションを動機づけ、早期大腸がん検出を支援する。
  • SwinV2 Transformer-UNET を FCBFormer フレームワークに統合してセグメンテーション性能を向上させる。
  • ベンチマークデータセットで一般化とデータ分割の整合性を評価する。

提案手法

  • FCBFormer のトランスフォーマーアーキテクチャを SwinV2 Transformer-UNET に置換する。
  • Fully Convolutional Network コンポーネントに小さな修正を適用する。
  • Kvasir-SEG および CVC-ClinicDB データセットでモデルを評価する。
  • データセット間の一般化テストを実施し、評価におけるデータリークの懸念について議論する。

実験結果

リサーチクエスチョン

  • RQ1SwinV2 Transformer-UNET の統合は元の FCBFormer よりポリプセグメンテーション性能を向上させるのか。
  • RQ2FCB-SwinV2 Transformer は標準的な大腸内視鏡セグメンテーションベンチマークで一般化するのか。
  • RQ3CVC-ClinicDB の評価で影響を与える評価上の落とし穴(例:データリーク)は何か。
  • RQ4このタスクにおける小さな FCN の修正は、トランスフォーマー ベースのセグメンテーションとどのように相互作用するのか。

主な発見

  • FCB-SwinV2 Transformer は、 tested benchmarks の前方のアプローチより一貫して高い mDice スコアを達成する。
  • モデルは報告された指標に従い、Kvasir-SEG および CVC-ClinicDB で最先端の性能を示す。
  • 一般化テストは、データセット間で堅牢な性能をサポートする。
  • 本研究は、評価上の問題を特定・議論しており、CVC-ClinicDB の評価におけるデータリークの可能性を含む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。