QUICK REVIEW

[論文レビュー] Uncertainty-driven Sanity Check: Application to Postoperative Brain Tumor Cavity Segmentation

Alain Jungo, Raphael Meier|arXiv (Cornell University)|Jun 8, 2018

Adversarial Robustness in Machine Learning参考文献 11被引用数 37

ひとこと要約

本稿では、モンテカルロドロップアウトを用いてボクセル単位の不確実性を推定する完全畳み込み型DenseNetを用いて、術後脳腫瘍巣のセグメンテーションにおける不確実性駆動型健全性チェックを提案する。この手法は、空間的事前知識と組み合わせることで、Diceスコア0.792 ± 0.154を達成し、最悪のセグメンテーション結果と4例中3例の外れ値を正常に特定した。臨床ワークフローにおける信頼性が向上した。

ABSTRACT

Uncertainty estimates of modern neuronal networks provide additional information next to the computed predictions and are thus expected to improve the understanding of the underlying model. Reliable uncertainties are particularly interesting for safety-critical computer-assisted applications in medicine, e.g., neurosurgical interventions and radiotherapy planning. We propose an uncertainty-driven sanity check for the identification of segmentation results that need particular expert review. Our method uses a fully-convolutional neural network and computes uncertainty estimates by the principle of Monte Carlo dropout. We evaluate the performance of the proposed method on a clinical dataset with 30 postoperative brain tumor images. The method can segment the highly inhomogeneous resection cavities accurately (Dice coefficients 0.792 $\pm$ 0.154). Furthermore, the proposed sanity check is able to detect the worst segmentation and three out of the four outliers. The results highlight the potential of using the additional information from the model's parameter uncertainty to validate the segmentation performance of a deep learning model.

研究の動機と目的

実臨床における変動要因を考慮した深層学習モデルの頑健性の欠如に対処すること。
専門家によるレビューを要する困難な症例を検出することで、自動セグメンテーションの臨床的受容性を向上させること。
放射線治療計画におけるセグメンテーション失敗を特定するための信頼性の高い信号として、モデルの不確実性を活用すること。
術後脳腫瘍巣セグメンテーションのための最初の完全畳み込み型ニューラルネットワークアプローチを提示すること。
不確実性推定値と空間的事前知識を統合した実用的な健全性チェックを構築し、故障検出能力を強化すること。

提案手法

T1、T1c、T2およびFLAIR画像系列における術後脳腫瘍巣の3次元セマンティックセグメンテーションを目的とした完全畳み込み型DenseNetアーキテクチャを採用する。
推論時にモンテカルロドロップアウトを適用し、再トレーニングを要せずベイジアン不確実性推定を可能にする。
解剖学的事前知識を組み込んだ空間的に重み付けされた平均不確実性としての「懐疑スコア」を計算する。
被験者間で入力データを標準化するために、アトラスへの剛体登録とzスコア強度正規化を用いる。
Dice係数と懐疑スコアを組み合わせた二段階閾値判断フレームワークを用い、症例を真陽性、偽陽性、偽陰性、真陰性に分類する。
健全性チェックの評価には、専門家による検証済みの真値を有する30例の膠芽腫患者の臨床データセットを用いる。

実験結果

リサーチクエスチョン

RQ1深層ニューラルネットワークからの不確実性推定は、術後脳腫瘍巣セグメンテーションにおけるセグメンテーション失敗を信頼性高く特定できるか？
RQ2空間的に注意を向ける懐疑スコアは、専門家によるレビューを要する困難な症例を検出するのにどの程度有効か？
RQ3提案手法は、臨床データセットにおける最悪のセグメンテーション結果と外れ値を検出できるか？
RQ4不均一性が著しい再切除巣において、不確実性とセグメンテーション精度の相関はどの程度強いか？
RQ5不確実性駆動型健全性チェックは、放射線治療計画における安全性を維持しつつ、完全な人為監視に依存するのを減らせるか？

主な発見

30例の臨床データセットにおいて、モデルはDice係数0.792 ± 0.154を達成し、高いセグメンテーション精度を示した。
不確実性駆動型健全性チェックは、最悪のセグメンテーション結果を正常に特定し、4例中3例の外れ値を検出できた。これは、強力な故障検出能力を示している。
高いDiceスコアだが高い不確実性を示す症例は、高リスクとしてフラグ付けされた。これは、本手法が微細な誤差を検出できる能力を有していることを裏付けた。
懐疑スコアにおける空間的事前知識の統合により、硬膜やサブアラッハ空間など解剖学的に複雑な領域における困難な症例の検出が向上した。
健全性チェックにおける偽陽性は、主に巣以外の領域における高い不確実性に起因しており、本手法が曖昧な組織的状況に敏感であることを示している。
本手法は、自動化と臨床的監視のバランスを取れる設定可能な監視レイヤーを提供し、臨床試験などの高スルーレート応用に適している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。