Skip to main content
QUICK REVIEW

[論文レビュー] Deep learning for automatic tumour segmentation in PET/CT images of patients with head and neck cancers

Yngve Mardal Moe, Aurora Rosvoll Groendahl|arXiv (Cornell University)|Aug 2, 2019
Medical Imaging Techniques and Applications参考文献 4被引用数 29
ひとこと要約

本研究では、PET/CT画像を用いた頭頸部がん患者における腫瘍巣および病理的リンパ節の自動分類を目的としたU-Netベースの深層学習モデルを提案する。モデルはPET/CT画像で0.75±0.12のDice類似係数を達成し、専門医による輪郭指定と同等の性能を示した。

ABSTRACT

An automatic segmentation algorithm for delineation of the gross tumour volume and pathologic lymph nodes of head and neck cancers in PET/CT images is described. The proposed algorithm is based on a convolutional neural network using the U-Net architecture. Several model hyperparameters were explored and the model performance in terms of the Dice similarity coefficient was validated on images from 15 patients. A separate test set consisting of images from 40 patients was used to assess the generalisability of the algorithm. The performance on the test set showed close-to-oncologist level delineations as measured by the Dice coefficient (CT: $0.65 \pm 0.17$, PET: $0.71 \pm 0.12$, PET/CT: $0.75 \pm 0.12$).

研究の動機と目的

  • 頭頸部がん患者における腫瘍巣および病理的リンパ節の自動化された深層学習手法の開発。
  • 手動による輪郭指定に起因する放射線治療計画における観察者間・観察者内ばらつきの低減。
  • CT、PET、およびPET/CT統合画像モodalitiesを用いたU-Netモデルの性能評価。
  • CTウィンドウ設定および損失関数選択が分類精度に与える影響の評価。
  • 訓練および検証に使用されなかった独立したテストセット40例におけるモデルの汎用性の検証。

提案手法

  • ゼロパディングおよびバッチ正則化を備えたU-Net畳み込みニューラルネットワークを、学習率10⁻⁴でAdam最適化法を用いて訓練した。
  • モデルは、共登録済みのPETおよびCT画像の軸断層画像を入力とし、正解ラベルは専門医がラベル付けしたGTVおよびリンパ節輪郭の和集合として定義された。
  • 3つの入力モダリティ(CTのみ、PETのみ、PET/CT統合)を評価し、CTウィンドウ設定は幅100および200 HU、中心値60および70 HUでテストした。
  • 分類性能の最適化を目的に、交差エントロピー損失関数とDice損失関数を訓練中に評価した。
  • ハイパーパrameterチューニングは15例の検証セットを用い、最終テストに使用する最良性能のモデルを選定した。
  • 最終モデルは、腫瘍Tステージで層別化された40例のホールドアウトテストセットを用いて評価され、汎用性が検証された。

実験結果

リサーチクエスチョン

  • RQ1U-Netアーキテクチャに基づく深層学習モデルは、頭頸部がんPET/CT画像において、専門医に匹敵する分類性能を達成できるか?
  • RQ2PETおよびCT画像モダリティを個別に、および併用した場合に、分類精度にどのような影響を与えるか?
  • RQ3CTウィンドウ設定は、深層学習モデルの腫瘍分類性能を向上させるか?
  • RQ4本臨床的文脈において、交差エントロピー損失関数とDice損失関数のどちらがより優れた分類結果をもたらすか?
  • RQ5訓練・検証に使用されなかった独立したテストセット(患者40例)における、訓練済みモデルの汎用性はどの程度か?

主な発見

  • PET/CTモデルはテストセットで最高のDice類似係数0.75±0.12を達成し、CTのみ(0.65±0.17)およびPETのみ(0.71±0.12)のモデルを上回った。
  • CTウィンドウ設定はモデル性能を顕著に向上させたが、ウィンドウパラメータ(100/60 HU 対 200/70 HU)間に有意差は認められなかった。
  • 損失関数の選択(交差エントロピー対Dice)は、モデル性能に有意差をもたらさなかった。
  • 感度はPET/CTモデルで最高の0.74±0.16を示し、陽性予測値は0.78±0.15であった。
  • 特異度は全モデルで一貫して高く(>0.99)あり、偽陽性率が低かった。
  • テストセットにおけるモデルの性能は、先行研究で報告された観察者間ばらつき(平均Dice 0.56–0.69)と同等であり、専門医水準の精度を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。