QUICK REVIEW

[論文レビュー] DeepSEED: 3D Squeeze-and-Excitation Encoder-Decoder ConvNets for Pulmonary Nodule Detection.

Yuemeng Li, Hangfan Liu|arXiv (Cornell University)|Apr 6, 2019

Lung Cancer Diagnosis and Treatment被引用数 7

ひとこと要約

本稿では、低線量CTスキャンにおける肺結節検出を改善するために、畳み込みニューラルネットワーク（CNN）の3次元エンコーダ・デコーダ構造に、スイープ・アンド・エクスカーション（squeeze-and-excitation）モジュールとリージョンプロポーザルネットワーク（RPN）を統合したDeepSEEDを提案する。動的スケーリングされたクロスエントロピー損失とアテンションベースの特徴学習を統合することで、誤検出を顕著に低減し、LIDC/IDRIおよびLUNA16データセットにおいて最先端の手法を上回る性能を達成した。

ABSTRACT

Pulmonary nodule detection plays an important role in lung cancer screening with low-dose computed tomography (CT) scans. It remains challenging to build nodule detection deep learning models with good generalization performance due to unbalanced positive and negative samples. In order to overcome this problem and further improve state-of-the-art nodule detection methods, we develop a novel deep 3D convolutional neural network with an Encoder-Decoder structure in conjunction with a region proposal network. Particularly, we utilize a dynamically scaled cross entropy loss to reduce the false positive rate and combat the sample imbalance problem associated with nodule detection. We adopt the squeeze-and-excitation structure to learn effective image features and utilize inter-dependency information of different feature maps. We have validated our method based on publicly available CT scans with manually labelled ground-truth obtained from LIDC/IDRI dataset and its subset LUNA16 with thinner slices. Ablation studies and experimental results have demonstrated that our method could outperform state-of-the-art nodule detection methods by a large margin.

研究の動機と目的

肺結節検出におけるクラス不均衡の課題に対処する。具体的には、陽性（結節あり）サンプルに比べて陰性（非結節）サンプルが著しく多い状況を想定する。
アテンション機構と損失再重み付けを活用することで、深層学習モデルの一般化性能を向上させる。
スイープ・アンド・エクスカーション機構により、特徴マップ間の相関関係をモデル化することで、特徴表現を強化する。
エンコーダ・デコーダ構造とリージョンプロポーザルネットワークを統合した、精度の高い局在化を実現する耐障害性の高い3次元畳み込みニューラルネットワークアーキテクチャを開発する。
LIDC/IDRIおよびそのLUNA16サブセットを含む公開データセットを用いて手法の妥当性を検証し、再現可能性と実世界への適用可能性を確保する。

提案手法

低線量CTスキャンから階層的なボリューム表現を学習するため、3次元エンコーダ・デコーダ畳み込みニューラルネットワークアーキテクチャを採用する。
チャネルごとの依存関係をモデル化し、情報量の多い特徴を強調することで特徴マップを再スケーリングするため、スイープ・アンド・エクスカーション（SE）ブロックを統合する。
候補となる結節領域を生成することで局在化精度を向上させるため、リージョンプロポーザルネットワーク（RPN）を活用する。
予測の信頼度に基づいて損失重みを動的に調整する動的スケーリングされたクロスエントロピー損失を適用し、誤検出を低減する。
LIDC/IDRIおよびLUNA16のグランドトゥルースアノテーションを用いて、CTボリュームの3次元パッチ上でモデルをエンドツーエンドで学習する。
特徴マップ間の相互依存関係を活用することで、特徴の識別性能とモデルの耐障害性を向上させる。

実験結果

リサーチクエスチョン

RQ13次元エンコーダ・デコーダネットワークにスイープ・アンド・エクスカーションモジュールを組み込むことで、低線量CTスキャンにおける肺結節検出のための特徴表現が向上するか？
RQ2動的スケーリングされたクロスエントロピー損失を用いることで、不均衡な結節検出における誤検出率が実際に効果的に低減されるか？
RQ3標準的な分類ヘッドと比較して、リージョンプロポーザルネットワークの統合が、局在化精度をどの程度向上させるか？
RQ4LUNA16およびLIDC/IDRIといったベンチマークデータセットにおいて、提案手法は最先端のモデルと比較してどの程度の性能を示すか？
RQ5深刻なクラス不均衡の状況下で、アテンションベースの特徴再スケーリングと損失再重み付けが、併用することでモデルの一般化性能を向上させるか？

主な発見

提案されたDeepSEEDモデルは、LIDC/IDRIおよびLUNA16データセットの両方において、既存の最先端手法を上回る肺結節検出性能を達成した。
動的スケーリングされたクロスエントロピー損失の適用により、トレーニング中に容易な陰性サンプルの重みを自動的に低減することで、誤検出率が顕著に低下した。
スイープ・アンド・エクスカーション機構により、チャネルごとの依存関係を明示的にモデル化することで、特徴表現が強化され、検出感度が向上した。
3次元エンコーダ・デコーダアーキテクチャとリージョンプロポーザルネットワークの組み合わせにより、小さな結節の局在化がより正確に可能になった。
アブレーションスタディの結果、アテンション機構と動的損失の両方が、独立してかつ相乗的に性能向上に寄与していることが確認された。
薄層CTスキャンに対しても良好な一般化性能を示し、さまざまな画像プロトコルにわたる耐障害性を実証した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。