[論文レビュー] Adversarial training and dilated convolutions for brain MRI segmentation
本論文では、識別器ネットワークを用いた敵対的訓練を提案し、より現実的で構造的に整合性のあるセグメンテーションを生成することで、脳MRIのセグメンテーションを改善する。標準的な交差エントロピー損失と敵対的損失を組み合わせることで、ノイズを低減し、特に深層畳み込みニューラルネットワークにおいてDiceスコアを向上させ、成人被験者では最大0.92のDice係数、高齢被験者では0.85のDice係数を達成した。
Convolutional neural networks (CNNs) have been applied to various automatic image segmentation tasks in medical image analysis, including brain MRI segmentation. Generative adversarial networks have recently gained popularity because of their power in generating images that are difficult to distinguish from real images. In this study we use an adversarial training approach to improve CNN-based brain MRI segmentation. To this end, we include an additional loss function that motivates the network to generate segmentations that are difficult to distinguish from manual segmentations. During training, this loss function is optimised together with the conventional average per-voxel cross entropy loss. The results show improved segmentation performance using this adversarial training procedure for segmentation of two different sets of images and using two different network architectures, both visually and in terms of Dice coefficients.
研究の動機と目的
- 深層学習ベースの脳MRIセグメンテーションの現実性と構造的整合性を向上させること。
- 局所的なボクセル単位の損失関数が、グローバルな構造的不整合を捉えられないという標準的な制限を解消すること。
- 敵対的訓練が、多様なネットワークアーキテクチャーやデータセットにおいてセグメンテーション性能を向上させるかどうかを評価すること。
- 敵対的損失が、断片的でノイズの多いセグメンテーションを低減する影響を調査すること。
- 本手法が成人および高齢者の脳MRIデータセットの両方において一般化可能であることを示すこと。
提案手法
- 完全畳み込みネットワークと拡張畳み込みネットワークを、標準的な交差エントロピー損失と敵対的損失の組み合わせで訓練する。
- 識別器ネットワークを、手動セグメンテーションとセグメンテーションネットワークからの生成セグメンテーションを区別するように訓練する。
- 画像パッチ(25×25)とセグメンテーションを連結し、識別器に供給することで、画像-セグメンテーション出力の現実性を評価する。
- 敵対的訓練では、交互に最適化を行う:セグメンテーションネットワークは学習率10⁻³、識別器は10⁻⁵で更新する。
- 訓練にはRMSpropを用い、51×51(完全結合)または87×87(拡張畳み込み)のパッチをランダムクロップすることでデータ拡張を実施する。
- 本手法は、MICCAI 2012(成人、6クラス)とMRBrainS13(高齢者、7クラス)の2つのデータセットに適用され、クラスバランスサンプリングが実施された。
実験結果
リサーチクエスチョン
- RQ1敵対的訓練は、脳MRIセグメンテーション出力の現実性と構造的整合性を向上させることができるか?
- RQ2識別器損失を含めることで、標準的な交差エントロピー訓練に比べてDice係数に測定可能な向上が見られるか?
- RQ3敵対的訓練は、セグメンテーションのノイズや成分数(例えば、分離領域の数)にどのように影響するか?
- RQ4完全畳み込みネットワークと拡張畳み込みネットワークの両アーキテクチャで、性能向上の程度に差があるか?
- RQ5本手法は、異なる年齢層やMRI撮影プロトコルの下でも有効であるか?
主な発見
- 敵対的訓練により、セグメンテーションのノイズが顕著に低減され、完全畳み込みネットワークを用いた成人被験者では、3D成分の平均数が1,745±400から626±247に減少した。
- 高齢被験者では、完全畳み込みネットワークを用いて成分数が926±134から692±88に低下し、構造的整合性の向上が示された。
- 成人被験者では、完全畳み込みネットワークを用いた場合、Dice係数が0.67±0.04から0.91±0.03に向上し、拡張畳み込みネットワークでは0.92±0.03に達した。
- 高齢被験者では、完全畳み込みネットワークを用いた場合、Diceスコアが0.80±0.02から0.83±0.02に向上し、拡張畳み込みネットワークでは0.85±0.01に向上した。これらの向上はすべて統計的に有意であった(p<0.05)。
- 改善効果は、より深い完全畳み込みネットワークで顕著に現れ、より複雑なアーキテクチャに対してより大きな利点が得られることを示唆した。
- 唯一有意でない改善が観察されたのは、高齢被験者における拡張畳み込みネットワークを用いたlvCSFであったが、他のすべての組織クラスにおいても全体的な向上は強く維持された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。