Skip to main content
QUICK REVIEW

[論文レビュー] TransNetR: Transformer-based Residual Network for Polyp Segmentation with Multi-Center Out-of-Distribution Testing

Debesh Jha, Nikhil Kumar Tomar|arXiv (Cornell University)|Mar 13, 2023
Colorectal Cancer Screening and Detection被引用数 27
ひとこと要約

TransNetRは、事前学習済みのResNet50エンコーダとResidual Transformerブロックを組み合わせたエンコーダ-デコーダのポリープセグメンテーションモデルで、リアルタイム性能と不可分データ(OOD)への強い一般化を、多施設データセットに跨って実現します。

ABSTRACT

Colonoscopy is considered the most effective screening test to detect colorectal cancer (CRC) and its precursor lesions, i.e., polyps. However, the procedure experiences high miss rates due to polyp heterogeneity and inter-observer dependency. Hence, several deep learning powered systems have been proposed considering the criticality of polyp detection and segmentation in clinical practices. Despite achieving improved outcomes, the existing automated approaches are inefficient in attaining real-time processing speed. Moreover, they suffer from a significant performance drop when evaluated on inter-patient data, especially those collected from different centers. Therefore, we intend to develop a novel real-time deep learning based architecture, Transformer based Residual network (TransNetR), for colon polyp segmentation and evaluate its diagnostic performance. The proposed architecture, TransNetR, is an encoder-decoder network that consists of a pre-trained ResNet50 as the encoder, three decoder blocks, and an upsampling layer at the end of the network. TransNetR obtains a high dice coefficient of 0.8706 and a mean Intersection over union of 0.8016 and retains a real-time processing speed of 54.60 on the Kvasir-SEG dataset. Apart from this, the major contribution of the work lies in exploring the generalizability of the TransNetR by testing the proposed algorithm on the out-of-distribution (test distribution is unknown and different from training distribution) dataset. As a use case, we tested our proposed algorithm on the PolypGen (6 unique centers) dataset and two other popular polyp segmentation benchmarking datasets. We obtained state-of-the-art performance on all three datasets during out-of-distribution testing. The source code of TransNetR will be made publicly available at https://github.com/DebeshJha.

研究の動機と目的

  • 臨床利用に適したリアルタイムで正確なポリープセグメンテーションを動機付ける。
  • unseen centers or distributionsでモデルを評価した際の一般化のギャップに対処する。
  • 速度を維持しつつ分布シフトに対するロバスト性を向上させるトランスフォーマー強化残差アーキテクチャを提案する。

提案手法

  • エンコーダとして事前学習済みのResNet50を用いたエンコーダ-デコーダアーキテクチャ。
  • エンコーダの中間特徴マップ4つを1x1畳み込みで圧縮し、スキップ接続付きの3ブロックデコーダへ入力。
  • Residual Transformer (RT) ブロックは畳み込み特徴とトランスフォーマー基づく自己注意を融合。
  • 最終デコーダ段はRTの代わりに残差ブロックを用いてパラメータ数を削減し、その後アップサンプリングとシグモイド1x1畳み込みでセグメンテーション。
Figure 1: Illustration of different scenarios expected to arise in real-world settings. The proposed work conducted both in-distribution and out-of-distribution validation process. C1 to C6 represent the different centers data present in PolypGen [ Ali et al.(2023)Ali, Jha, Ghatwary, Realdon, Canniz
Figure 1: Illustration of different scenarios expected to arise in real-world settings. The proposed work conducted both in-distribution and out-of-distribution validation process. C1 to C6 represent the different centers data present in PolypGen [ Ali et al.(2023)Ali, Jha, Ghatwary, Realdon, Canniz

実験結果

リサーチクエスチョン

  • RQ1TransNetRは、インディストリビューション内のポリープセグメンテーションベンチマークで最先端手法と比較してどの程度性能を発揮するか?
  • RQ2TransNetRは複数センター/データセットからのOODデータに一般化できるか(OODテスト)?
  • RQ3Residual Transformerブロックがセグメンテーション精度およびモデル効率に及ぼす影響は?
  • RQ4多様なデータセットで高品質なセグメンテーションを維持しつつリアルタイム推論速度を確保できるか?

主な発見

方法mIoUmDSCRec.Prec.F2FPSPara.Flops
U-Net0.74720.82640.85040.87030.8353106.8831.0454.75
U-Net++0.74200.82280.84370.86070.829581.349.1634.65
ResU-Net++0.53410.64530.69640.70800.657643.114.0615.81
HarDNet-MSEG0.74590.82600.84850.86520.835834.8033.346.02
ColonSegNet0.69800.79200.81930.84320.799973.955.0162.16
UACANet0.76920.85020.87990.87060.862625.8569.1631.51
UNeXt0.62840.73180.78400.76560.750787.471.470.57
TransNetR (Ours)0.80160.87060.88430.90730.874454.6027.2710.58
  • TransNetRはKvasir-SEGテストセットでDice係数0.8706、mean IoU 0.8016、リコール0.8843、適合率0.9073を54.60 FPSで達成。
  • OODテスティングではPolypGen(6センター)、BKAI-IGH、CVC-ClinicDBデータセットで最先端の性能を発揮。
  • アブレーションによりResidual Transformer(RT)ブロックはRTなしの変種と比較して指標を改善(例:mIoU+1.34%)しつつリアルタイム速度を維持。
  • 複数のOOD評価において、TransNetRは中心別およびデータセット別の分析で競合他社(UACANetやUNeXt)を一貫して上回り、mIoUとDSCで優位。
  • センター別の結果は、多様なセンターからのデータに対してロバストな性能を示し、小さなポリップや複数のポリップを含むケースでも境界の正確な描写を達成。
Figure 2: Block diagram of TransNetR along with the Residual Transformer block
Figure 2: Block diagram of TransNetR along with the Residual Transformer block

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。