[論文レビュー] Deep learning to achieve clinically applicable segmentation of head and neck anatomy for radiotherapy
3D U-Net ベースのモデルが CT 計画スキャンにおける頭頸部の21個の臓器感受性を専門放射線技師レベルでセグメントし、臨床的修正努力を反映する新しい surface Dice similarity coefficient を導入、複数データセットにおける一般化を実証。
Over half a million individuals are diagnosed with head and neck cancer each year worldwide. Radiotherapy is an important curative treatment for this disease, but it requires manual time consuming delineation of radio-sensitive organs at risk (OARs). This planning process can delay treatment, while also introducing inter-operator variability with resulting downstream radiation dose differences. While auto-segmentation algorithms offer a potentially time-saving solution, the challenges in defining, quantifying and achieving expert performance remain. Adopting a deep learning approach, we demonstrate a 3D U-Net architecture that achieves expert-level performance in delineating 21 distinct head and neck OARs commonly segmented in clinical practice. The model was trained on a dataset of 663 deidentified computed tomography (CT) scans acquired in routine clinical practice and with both segmentations taken from clinical practice and segmentations created by experienced radiographers as part of this research, all in accordance with consensus OAR definitions. We demonstrate the model's clinical applicability by assessing its performance on a test set of 21 CT scans from clinical practice, each with the 21 OARs segmented by two independent experts. We also introduce surface Dice similarity coefficient (surface DSC), a new metric for the comparison of organ delineation, to quantify deviation between OAR surface contours rather than volumes, better reflecting the clinical task of correcting errors in the automated organ segmentations. The model's generalisability is then demonstrated on two distinct open source datasets, reflecting different centres and countries to model training. With appropriate validation studies and regulatory approvals, this system could improve the efficiency, consistency, and safety of radiotherapy pathways.
研究の動機と目的
- 放射線治療計画のための頭頸部臓器危険領域の手動による描出における時間性・ばらつき・安全性の課題に対処する。
- 臨床的に代表的なデータに対して専門放射線技師のパフォーマンスに到達する深層学習セグメンテーションモデルを開発・検証する。
- 自動セグメンテーションの修正作業量を反映する臨床的に意味のある評価指標(surface DSC)を提案する。)
提案手法
- 計画 CT スキャン上で21個の臓器感受性を描出するために 3D U-Net アーキテクチャを用いる。
- 臨床的に出典されたセグメンテーションと放射線技師作成セグメンテーションを含む routine practice からの663 件の CT スキャンで学習する。
- 同じ病院の 21 件の CT スキャンを用いたテストセットと、一般化可能性を検証するためのオープンソースデータセットの2つの独立した専門家と対比して評価する。
- 臓器特有の許容範囲内での表面重なりを測定する surface Dice similarity coefficient(surface DSC)を導入し、体積よりも編集可能な境界領域に焦点を当てる。
- モデルのパフォーマンスを経験豊富な放射線技師および腫瘍医のグラウンドトゥルース審判と比較して専門家レベルのパフォーマンスを確立する。
実験結果
リサーチクエスチョン
- RQ1計画 CT スキャン上の頭頸部 OAR の 21 個の描出を深層学習モデルで専門家レベルに達成できるか。
- RQ2モデルは異なるデモグラフィックとイメージングプロトコルを持つ外部データセットへ一般化できるか。
- RQ3表面に焦点を当てた評価指標(surface DSC)は臨床修正作業量をより良く反映するか。
- RQ4代表的なテストセットでのモデルと放射線技師および腫瘍医の比較性能はどうなるか。
主な発見
- モデルは UCLH テストセットで 21 個の OAR 全てに対して表面 DSC の性能が臓器特異的許容範囲内で放射線技師に近い。
- TCIA のオープンソーステストセットでは、19/21 の OAR で放射線技師と同等の性能を示し、脳幹と右レンズの2臓器は画像品質の影響により放射線技師パフォーマンスを下回った可能性がある。
- 臓器特異的許容範囲内で表面レベルの合意を定量化する新規の surface Dice similarity coefficient(surface DSC)を導入し、臨床的に関連する修正評価を示した。
- 3つのテストコホート(UCLH、TCIA、PDDCA)に跨る一般化を実証し、異なるセンター・デモグラフィック・スキャナー/プロトコルの違いに対する頑健性を示した。
- 著者は TCIA ラベル付きデータセットを公開し、放射線治療計画の自動セグメンテーションにおける客観的比較と今後の研究を支援した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。