QUICK REVIEW

[論文レビュー] Deep Reinforcement Learning for Organ Localization in CT

Fernando Navarro, Anjany Sekuboyina|arXiv (Cornell University)|May 11, 2020

Advanced Neural Network Applications被引用数 24

ひとこと要約

本論文は、CTスキャンにおける臓器局在化のための深層強化学習（DRL）手法を提案する。11のカスタムアクション（3次元移動）を用いて、臓器を取り囲む3次元バウンディングボックスを反復的に変形する。本手法は、公的VISCERALデータセットを用いて70件のトレーニングスキャンのみで、0.63のIoU、2.25 mmの中央壁距離、3.65 mmの中央点距離を達成し、教師あり学習と比較して低データ環境下でも最先端の性能を示した。

ABSTRACT

Robust localization of organs in computed tomography scans is a constant pre-processing requirement for organ-specific image retrieval, radiotherapy planning, and interventional image analysis. In contrast to current solutions based on exhaustive search or region proposals, which require large amounts of annotated data, we propose a deep reinforcement learning approach for organ localization in CT. In this work, an artificial agent is actively self-taught to localize organs in CT by learning from its asserts and mistakes. Within the context of reinforcement learning, we propose a novel set of actions tailored for organ localization in CT. Our method can use as a plug-and-play module for localizing any organ of interest. We evaluate the proposed solution on the public VISCERAL dataset containing CT scans with varying fields of view and multiple organs. We achieved an overall intersection over union of 0.63, an absolute median wall distance of 2.25 mm, and a median distance between centroids of 3.65 mm.

研究の動機と目的

放射線治療、画像検索、登録のための重要な前処理ステップである、CTスキャンにおける頑健な臓器局在化の課題に対処すること。
大規模なアノテート済みデータセットに依存するか、計算コストの高い手法（例：マルチアトラス登録）に依存する現在の手法の限界を克服すること。
人為的アノテーションデータに依存する必要を最小限に抑える、データ効率の良い臓器局在化ソリューションを開発すること。
1つの汎用的な強化学習エージェントを用いて、任意の臓器を即座に利用可能な形で局在化できるようにすること。
強化学習が、教師あり深層学習手法と比較して著しく少ないトレーニングスキャンで、臓器局在化を効果的に学習できることを示すこと。

提案手法

人工エージェントが臓器の周囲の3次元バウンディングボックスを最適化するように学習する、3次元CT環境における逐次的意思決定問題として臓器局在化を定式化する。
6つの3次元移動、3つの軸方向のスケーリング、2つのグローバルスケーリングを含む、合計11のアクションからなる独自のアクション空間を設計し、形状やサイズが異なる臓器に柔軟に適合できるボックス変形を可能にする。
深層Qネットワーク（DQN）エージェントを、IoUの向上度と真値への近接度に基づく密集したスパarsな報酬を受け取る形で、深層強化学習により訓練する。
段階的学習戦略を採用し、段階的に局在化タスクの複雑さを増加させることで、トレーニングの安定性と収束性を向上させる。
公的VISCERALデータセットの70件のCTスキャンからなる小規模なデータセット上でエージェントを訓練し、1件のスキャンから無限に多くのトレーニング軌道を生成できるエージェントの能力を活用する。
状態表現を現在のバウンディングボックスを中心とする3次元クロップとし、3次元畳み込みニューラルネットワークを用いて空間特徴を抽出し、アクション選択に用いる。

実験結果

リサーチクエスチョン

RQ1大規模なアノテート済みデータセットを必要とせずに、深層強化学習がCTスキャンにおける臓器局在化を効果的に学習できるか？
RQ2臓器の形状やサイズの変動に適応するようにカスタマイズされたアクション空間は、標準的な移動のみのアクションと比較して、強化学習ベースの局在化においてどのように優れているか？
RQ3DRLは、教師あり深層学習手法と比較して著しく少ないトレーニングスキャンで、競争力のある局在化性能を達成できるか？
RQ41つの統一された方策を用いて、多様な解剖的外観、サイズ、視野を持つ臓器に一般化できるか？
RQ5RLの逐次的かつ自己学習的な性質により、無限に多くの潜在的軌道が存在する条件下で、限られた数のCTスキャンから効果的に学習できるか？

主な発見

提案手法は、VISCERALデータセットにおける7つの臓器で平均交差率（IoU）0.63を達成し、高い局在精度を示した。
予測されたバウンディングボックスと真値の間の中央壁距離の中央値は2.25 mmであり、臓器境界の高精度な一致を示している。
予測された臓器中心点と真値の中心点の間の距離の中央値は3.65 mmであり、形状やサイズの変動に対しても中心点の正確な局在化を示している。
本手法は、教師あり学習のベースラインをすべて上回り、データ効率の面で優れており、70件のトレーニングスキャンでの競争力ある結果を達成した（最先端のCNNベース手法に比べて約20倍少ない）。
エージェントは多様な解剖的構造とスキャン視野を持つ臓器を効果的に局在化した。これは、本手法の頑健性と一般化能力を確認するものである。
カスタマイズされた11アクション空間の使用により、アスペクト比が異なる臓器に適応するためのボックス変形が効果的に可能になった。これは、標準的な移動のみのアクションでは達成できなかった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。