[論文レビュー] Asymmetric Similarity Loss Function to Balance Precision and Recall in Highly Unbalanced Deep Medical Image Segmentation
本稿では、極度に不均衡な3D医療画像セグメンテーションにおける適合率と再現率のバランスを取るために、$F_\beta$スコアに基づく非対称類似性損失関数を提案する。パッチ単位の3D密接続ネットワークと重複パッチ、Bスpline重み付きソフト投票による統合、および非対称損失を組み合わせることで、F1およびF2スコア、および適合率-再現率曲線下積分(AUPRC)が向上し、MSSEG 2016では69.8%、ISBI 2015では65.74%のDiceスコアを達成した。
Fully convolutional deep neural networks have been asserted to be fast and precise frameworks with great potential in image segmentation. One of the major challenges in utilizing such networks raises when data is unbalanced, which is common in many medical imaging applications such as lesion segmentation where lesion class voxels are often much lower in numbers than non-lesion voxels. A trained network with unbalanced data may make predictions with high precision and low recall, being severely biased towards the non-lesion class which is particularly undesired in medical applications where false negatives are actually more important than false positives. Various methods have been proposed to address this problem including two step training, sample re-weighting, balanced sampling, and similarity loss functions. In this paper we developed a patch-wise 3D densely connected network with an asymmetric loss function, where we used large overlapping image patches for intrinsic and extrinsic data augmentation, a patch selection algorithm, and a patch prediction fusion strategy based on B-spline weighted soft voting to take into account the uncertainty of prediction in patch borders. We applied this method to lesion segmentation based on the MSSEG 2016 and ISBI 2015 challenges, where we achieved average Dice similarity coefficient of 69.8% and 65.74%, respectively, using our proposed patch-wise 3D densely connected network. Significant improvement in $F_1$ and $F_2$ scores and the area under the precision-recall curve was achieved in test using the asymmetric similarity loss layer and our 3D patch prediction fusion method. The asymmetric similarity loss function based on $F_\beta$ scores generalizes the Dice similarity coefficient and can be effectively used with the patch-wise strategy developed here to train fully convolutional deep neural networks for highly unbalanced image segmentation.
研究の動機と目的
- 病変ボクセルが非病変ボクセルに比べて著しく少ない、極度に不均衡な医療画像セグメンテーションの課題に対処すること。
- 深層学習モデルにおいて、多数クラス(非病変)に偏りが生じるのを軽減し、再現率が低く、偽陰性率が高くなるのを防ぐこと。
- 特に診断の見逃しを最小限に抑えるために再現率を優先しつつ、適合率と再現率の両方を向上させること。
- Dice係数の一般化を図り、$F_\beta$に基づく最適化によって臨床的優先順位とより整合性のとれた損失関数を開発すること。
- パッチベースの学習とBスプライン重み付きソフト投票による不確実性を考慮した統合を統合し、境界予測の信頼性を高めること。
提案手法
- 大規模で重複する画像パッチ上でトレーニングされた3D密接続畳み込みニューラルネットワークを用いて、特徴の学習とロバスト性を向上させる。
- パッチ選択アルゴリズムを用いて、病変領域の多様性とカバー範囲を確保する。
- 重複するパッチからの予測をBスプライン重み付きソフト投票戦略で統合し、パッチ境界での不確実性を低減する。
- 非対称類似性損失関数を導入し、クラス不均衡な状況下で再現率を適合率よりも優先する。
- この損失関数はDice係数を一般化しており、トレーニング中にエンドツーエンドで最適化され、レアクラスのセグメンテーション性能が向上する。
- パッチに内在的および外在的データ拡張を適用し、トレーニングの多様性とモデルの一般化能力を向上させる。
実験結果
リサーチクエスチョン
- RQ1$F_\beta$スコアに基づく非対称損失関数は、極度に不均衡な3D医療画像セグメンテーションにおいて、適合率と再現率のバランスを効果的に取ることができるか?
- RQ2重複パッチを用いたパッチ単位のトレーニングとソフト投票統合は、特に病変境界でのセグメンテーション精度をどのように向上させるか?
- RQ3提案された損失関数は、F1およびF2スコア、および適合率-再現率曲線下積分(AUPRC)において、標準的なDice損失をどの程度上回るか?
- RQ4非対称損失を3D密接続ネットワークと統合することで、MSSEG 2016やISBI 2015のようなベンチマークデータセットで性能が向上するか?
主な発見
- 提案された非対称類似性損失関数は、標準的なDiceベースのトレーニングと比較して、F1およびF2スコアを顕著に向上させた。
- MSSEG 2016チャレンジデータセットでは、平均Dice類似係数が69.8%に達した。
- ISBI 2015チャレンジデータセットでは、Dice類似係数が65.74%に達した。
- 適合率-再現率曲線下積分(AUPRC)が顕著に向上し、少数クラス(病変)における性能向上が示された。
- Bスプライン重み付きソフト投票統合戦略は、パッチ境界での予測不確実性を効果的に低減し、境界局在精度を向上させた。
- パッチ単位のトレーニング、非対称損失、および密接続構造の組み合わせにより、評価されたベンチマークで最先端の性能を達成した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。