QUICK REVIEW

[論文レビュー] Attention Based Glaucoma Detection: A Large-scale Database and CNN Model

Liu Li, Mai Xu|arXiv (Cornell University)|Mar 26, 2019

Retinal Imaging and Analysis参考文献 40被引用数 25

ひとこと要約

本論文では、網膜画像を用いた緑内障検出のための注目型畳み込みニューラルネットワークであるAG-CNNを提案する。本研究では、5,824枚の画像を含む新規の大規模なLAGデータベースと、人間の眼科医が描いた注目マップを活用した。注目マップ予測、ガイドドバックプロパゲーションを用いた病理的領域の局在化、および緑内障分類を統合することで、AG-CNNは95.3%の正確性と95.4%の感度を達成し、最先端の手法を顕著に上回った。

ABSTRACT

Recently, the attention mechanism has been successfully applied in convolutional neural networks (CNNs), significantly boosting the performance of many computer vision tasks. Unfortunately, few medical image recognition approaches incorporate the attention mechanism in the CNNs. In particular, there exists high redundancy in fundus images for glaucoma detection, such that the attention mechanism has potential in improving the performance of CNN-based glaucoma detection. This paper proposes an attention-based CNN for glaucoma detection (AG-CNN). Specifically, we first establish a large-scale attention based glaucoma (LAG) database, which includes 5,824 fundus images labeled with either positive glaucoma (2,392) or negative glaucoma (3,432). The attention maps of the ophthalmologists are also collected in LAG database through a simulated eye-tracking experiment. Then, a new structure of AG-CNN is designed, including an attention prediction subnet, a pathological area localization subnet and a glaucoma classification subnet. Different from other attention-based CNN methods, the features are also visualized as the localized pathological area, which can advance the performance of glaucoma detection. Finally, the experiment results show that the proposed AG-CNN approach significantly advances state-of-the-art glaucoma detection.

研究の動機と目的

深層学習モデルにおける正確な緑内障検出を妨げる網膜画像の高レベルな冗長性に対処すること。
医療画像における人間の眼科医の注目領域と病理的領域のギャップを埋めること。
注目マップの予測と病理的領域の局在化を同時に実行するCNNアーキテクチャを開発し、診断性能を向上させること。
訓練および評価のための、臨床的に関連性のある大規模なデータベースを構築すること。このデータベースには、緑内障ラベルに加え、専門家がアノテートした注目マップが含まれる。

提案手法

模擬的アイトラッキングを用いて収集した、網膜画像5,824枚に加え、緑内障診断ラベルと眼科医の注目マップを含むLAGデータベースを構築した。
注目マップ予測サブネット、ガイドドバックプロパゲーションを用いた病理的領域局在化サブネット、および緑内障分類サブネットの3つのサブネットを備えたAG-CNNを設計した。
ガイドドバックプロパゲーションを用いて注目マップを精緻化し、網膜乳頭の境界など微小な病理的領域を強調することで、局在化の正確性を向上させた。
異なる受容野スケールに対応する特徴表現の強化とモデルの頑健性向上のため、マルチスケールリサンプルブロックを統合した。
視覚化されたヒートマップと真値の注目マップとの間のピアソン積率相関係数（CC）を用いて、人間の知覚との整合性を評価した。
アブレーションスタディを実施し、完全なAG-CNNアーキテクチャにおいて注目マップ予測および病理的領域局在化サブネットの必要性を検証した。

実験結果

リサーチクエスチョン

RQ1CNNに人間がアノテートした注目マップを組み込むことで、網膜画像における緑内障検出性能が向上するか？
RQ2注目型特徴可視化は、標準的なCAMベースの手法と比較して、視神経杯や乳頭境界のような微細な病理的領域をどれほど効果的に局在化できるか？
RQ3予測された注目マップとガイドドバックプロパゲーションの統合は、解釈可能性と分類正確性の両方を向上させるか？
RQ4注目マップ予測サブネットと病理的領域局在化サブネットは、AG-CNNモデル全体の性能にどの程度寄与しているか？
RQ5マルチスケールリサンプルブロックアーキテクチャは、標準的なリサンプル接続を上回り、さらに緑内障検出性能を向上させるか？

主な発見

LAGテストセットにおいて、AG-CNNは95.3%の正確性、95.4%の感度、95.2%の特異性、0.975のAUCを達成し、最先端の手法を顕著に上回った。
注目マップ予測サブネットと病理的領域局在化サブネットの両方を含めた場合、両方のコンponentsを削除した場合と比較してF2スコアが4.7%向上した。
アブレーションスタディの結果、注目マップ予測サブネットを削除したが局在化サブネットを維持した場合、正確性は87.1%に低下した。これは、効果的な局在化に予測された注目マップの必要性を示している。
ガイドドバックプロパゲーションに基づく局在化は、網膜乳頭の縁など微小な病理的領域を効果的に強調したが、CAMベースの手法はしばしば赤緑の網膜境界など冗長な領域を強調していた。
マルチスケールブロックは、標準的なリサンプル接続よりも性能を向上させ、従来のショートカットに置き換えた場合、正確性が92.2%に上昇した。
正しく分類されたケースでは、視覚化されたヒートマップと専門家の注目マップとのピアソン積率相関係数が0.33であったのに対し、誤分類されたケースでは0.14であった。これは、注目マップの整合性が診断の正しさに関連していることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。