[論文レビュー] Automatic Liver Lesion Detection using Cascaded Deep Residual Networks
この論文は cascaded deep residual networks (ResNet) with multi-scale fusion を用いて CT から肝臓と肝病変を自動セグメンテーションし、最先端の結果を達成。LiTS challenge で 4 位に入賞。
Automatic segmentation of liver lesions is a fundamental requirement towards the creation of computer aided diagnosis (CAD) and decision support systems (CDS). Traditional segmentation approaches depend heavily upon hand-crafted features and a priori knowledge of the user. As such, these methods are difficult to adopt within a clinical environment. Recently, deep learning methods based on fully convolutional networks (FCNs) have been successful in many segmentation problems primarily because they leverage a large labelled dataset to hierarchically learn the features that best correspond to the shallow visual appearance as well as the deep semantics of the areas to be segmented. However, FCNs based on a 16 layer VGGNet architecture have limited capacity to add additional layers. Therefore, it is challenging to learn more discriminative features among different classes for FCNs. In this study, we overcome these limitations using deep residual networks (ResNet) to segment liver lesions. ResNet contain skip connections between convolutional layers, which solved the problem of the training degradation of training accuracy in very deep networks and thereby enables the use of additional layers for learning more discriminative features. In addition, we achieve more precise boundary definitions through a novel cascaded ResNet architecture with multi-scale fusion to gradually learn and infer the boundaries of both the liver and the liver lesions. Our proposed method achieved 4th place in the ISBI 2017 Liver Tumor Segmentation Challenge by the submission deadline.
研究の動機と目的
- CT 画像でのCAD/CDS の自動的で正確な肝病変セグメンテーションを動機付ける。
- 浅い FCN の制約を克服するために、識別的特徴学習のための深い残差ネットワークを使用する。
- 肝臓と病変の境界を逐次 refine する cascaded ResNet アーキテクチャを提案する。
- センター間で異なる解像度を扱うためにマルチスケール融合を取り入れる。
提案手法
- セグメンテーションのために ResNet を変換してアップサンプリングと拡張畳み込みを用いた FCN 的モデルにする。
- 訓練時および推論時に前回の反復確率マップを用いて肝臓と病変のセグメンテーションを refine する cascaded ResNet フレームワークを構築する。
- マルチスケールの入力リサイズと出力の平均化を適用して最終予測を得る(マルチスケール融合)。
- CT を Hounsfield 単位ウィンドウニングと [0,1] への正規化で前処理する。
- ImageNet からのファインチューニングを経て、ドメイン固有のファインチューニングを行い、データ拡張と SGD 最適化を用いる。
実験結果
リサーチクエスチョン
- RQ1ResNet ベースのアーキテクチャは肝臓および肝病変のセグメンテーションにおいて VGGNet ベースの FCN を上回り得るか。
- RQ2逐次 refine を伴う cascaded ResNet は肝臓と病変の境界精度を向上させるか。
- RQ3マルチスケール融合は異なるセンターの CT 研究間で頑健な性能を提供するか。
- RQ43D-CRF 後処理を cascaded ResNet セグメンテーションへ追加する影響は何か。
主な発見
| Method | Liver Dice | Lesion Dice | Liver Jaccard | Lesion Jaccard |
|---|---|---|---|---|
| VGG-FCN | 91.96 | 29.88 | 85.47 | 19.65 |
| ResNet | 95.27 | 48.50 | 91.17 | 37.24 |
| Cascaded ResNet | 95.51 | 49.83 | 91.45 | 38.59 |
| Cascaded ResNet (w 3D-CRF) | 95.24 | 31.65 | 91.01 | 23.86 |
| Cascaded ResNet (w Multi-scale Fusion) | 95.90 | 50.01 | 92.19 | 38.79 |
- Cascaded ResNet は肝臓と病変のセグメンテーションで VGG ベースの FCN を上回る。
- Post-processing なしの Cascaded ResNet は Dice が 95.51%(肝臓)および 49.83%(病変)、Jaccard が 91.45%(肝臓)および 38.59%(病変)。
- マルチスケール融合を用いた Cascaded ResNet は最良の結果を示し:Dice 95.90%(肝臓)および 50.01%(病変);Jaccard 92.19%(肝臓)および 38.79%(病変)。
- 3D-CRF 後処理はベースの cascaded ResNet と比較して病変セグメンテーション性能を低下させる。
- マルチスケール融合は研究解像度とセンターの異なる状況に頑健性を提供し、LiTS 提出でトップ成績の要因となり(4 位)となった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。