[論文レビュー] HarDNet-MSEG: A Simple Encoder-Decoder Polyp Segmentation Neural Network that Achieves over 0.9 Mean Dice and 86 FPS
HarDNet-MSEG は HarDNet68 バックボーンと cascaded partial decoder を用いて、最先端のポリプ分割精度を実現します(Kvasir-SEG での mean Dice >0.9)、高速性は 86 FPS。
We propose a new convolution neural network called HarDNet-MSEG for polyp segmentation. It achieves SOTA in both accuracy and inference speed on five popular datasets. For Kvasir-SEG, HarDNet-MSEG delivers 0.904 mean Dice running at 86.7 FPS on a GeForce RTX 2080 Ti GPU. It consists of a backbone and a decoder. The backbone is a low memory traffic CNN called HarDNet68, which has been successfully applied to various CV tasks including image classification, object detection, multi-object tracking and semantic segmentation, etc. The decoder part is inspired by the Cascaded Partial Decoder, known for fast and accurate salient object detection. We have evaluated HarDNet-MSEG using those five popular datasets. The code and all experiment details are available at Github. https://github.com/james128333/HarDNet-MSEG
研究の動機と目的
- 大腸内視鏡画像によるCRC予防のための高速で正確なポリプ分割を動機づける。
- メモリ効率の高いバックボーンを備えたシンプルなエンコーダ-デコーダアーキテクチャを提案する。
- 5つの主要なポリプデータセットで評価し、最先端の精度と速度を確立する。
- Dice、IoU、FPSの向上を定量化するために、U-Net、PraNet、他の最先端モデルと比較する。
提案手法
- メモリトラフィックを削減し推論速度を向上させるため、HarDNet68 をバックボーンとして採用する。
- 高速顕著物体検出に触発された cascaded partial decoder を備えたシンプルなエンコーダ-デコーダアーキテクチャを採用する。
- 受容野を拡大するため、スキップ接続に Receptive Field Block (RFB) を組み込む。
- アップサンプリング後に要素ごとの乗算による密集集約を適用し特徴を融合する。
- prior works に触発された2つの異なる設定でトレーニングし、データセット間の堅牢な比較を保証する。
実験結果
リサーチクエスチョン
- RQ1HarDNet-MSEG は標準データセット全体で mean Dice および IoU において現在のSOTAポリプ分割法を上回ることができますか?
- RQ2HarDNet68 バックボーンを用いたシンプルなエンコーダ-デコーダが、高い推論速度を維持しつつ競争力のある精度を達成しますか?
- RQ3 cascaded partial decoder および RFB-enabled スキップ接続が境界精度や小さなポリプの分割に与える影響は?
- RQ4Kvasir-SEG、CVC-ColonDB、EndoScene、ETIS-Larib Polyp DB、CVC-Clinic DB における HarDNet-MSEG の PraNet および U-Net 系統と比較した性能は?
主な発見
| mIoU | mDice | F2スコア | 適合率 | 再現率 | 総合精度 | FPS | |
|---|---|---|---|---|---|---|---|
| U-Net | 0.471 | 0.597 | 0.598 | 0.672 | 0.617 | 0.894 | 11 |
| ResUNet | 0.572 | 0.690 | 0.699 | 0.745 | 0.725 | 0.917 | 15 |
| ResUNet++ | 0.613 | 0.714 | 0.720 | 0.784 | 0.742 | 0.917 | 7 |
| FCN8 | 0.737 | 0.831 | 0.825 | 0.882 | 0.835 | 0.952 | 25 |
| HRNet | 0.759 | 0.845 | 0.847 | 0.878 | 0.859 | 0.952 | 12 |
| DoubleUNet | 0.733 | 0.813 | 0.820 | 0.861 | 0.840 | 0.949 | 7.5 |
| PSPNet | 0.744 | 0.841 | 0.831 | 0.890 | 0.836 | 0.953 | 17 |
| DeepLabv3+[ResNet50] | 0.776 | 0.857 | 0.855 | 0.891 | 0.862 | 0.961 | 28 |
| DeepLabv3+[ResNet101] | 0.786 | 0.864 | 0.857 | 0.906 | 0.859 | 0.961 | 17 |
| U-Net[ResNet34] | 0.810 | 0.876 | 0.862 | 0.944 | 0.860 | 0.968 | 35 |
| HarDNet-MSEG | 0.848 | 0.904 | 0.915 | 0.907 | 0.923 | 0.969 | 86.7 |
- HarDNet-MSEG は、試験した5つのデータセットすべてで最先端の mean Dice および mIoU を達成した。
- Kvasir-SEG では、RTX 2080 Ti 上で 0.904 mean Dice を 86.7 FPS で達成。
- mean Dice および mIoU 指標で一貫して U-Net[ResNet34] および PraNet を上回る。
- 精度を維持または向上させつつ、複数の競合モデルより推論速度(FPS)が速いことを示す。
- 定性的な結果で境界の明確な描写と全体的なセグメンテーション品質を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。