QUICK REVIEW

[論文レビュー] Convolutional Neural Networks for Histopathology Image Classification: Training vs. Using Pre-Trained Networks

Brady Kieffer, Morteza Babaie|arXiv (Cornell University)|Oct 11, 2017

AI in cancer detection参考文献 18被引用数 23

ひとこと要約

本研究では、キミアパス24データセットにおけるヒストパスロジー画像分類において、事前学習済み畳み込みニューラルネットワーク（CNN）とスクラッチからのCNN学習を評価している。特にInception-v3を用いた事前学習ネットワークからの深層特徴量を用いることで、優れた精度（最高で76.10％のトップ1精度）を達成した。微調整によりInceptionでは顕著な向上が得られたが、VGG16では得られなかった。これは、医療画像分類タスクにおいて適切に適用された転移学習が極めて有効であることを示している。

ABSTRACT

We explore the problem of classification within a medical image data-set based on a feature vector extracted from the deepest layer of pre-trained Convolution Neural Networks. We have used feature vectors from several pre-trained structures, including networks with/without transfer learning to evaluate the performance of pre-trained deep features versus CNNs which have been trained by that specific dataset as well as the impact of transfer learning with a small number of samples. All experiments are done on Kimia Path24 dataset which consists of 27,055 histopathology training patches in 24 tissue texture classes along with 1,325 test patches for evaluation. The result shows that pre-trained networks are quite competitive against training from scratch. As well, fine-tuning does not seem to add any tangible improvement for VGG16 to justify additional training while we observed considerable improvement in retrieval and classification accuracy when we fine-tuned the Inception structure.

研究の動機と目的

事前学習済みディープニューラルネットワークとスクラッチからのCNN学習の性能を、ヒストパスロジー画像分類タスクにおいて評価すること。
限られた医療用トレーニングデータを用いた場合の、転移学習および微調整が分類精度に与える影響を評価すること。
非医療分野のデータセット（例：ImageNet）から得た事前学習特徴量が、ヒストパスロジー画像認識タスクに効果的に一般化できるかどうかを検証すること。
特にVGG16とInception-v3の間のアーキテクチャの違いが、転移学習の有効性に与える影響を調査すること。
大規模なアノテート済みデータセットが不足するデジタル病理会診分野において、転移学習の実用性を実証的根拠をもって示すこと。

提案手法

ImageNetで事前学習されたCNN（VGG16、Inception-v3）の最終全結合層から深層特徴量を抽出した。
ネットワーク重みを更新しない状態で、抽出した特徴量を用いて線形SVM分類器をトレーニングした。
Kimia Path24データセット上で、ネットワーク重みの一部またはすべてを更新することで、事前学習済みネットワークの微調整を行った。
スクラッチからの学習の過程で、トレーニングセットのサイズを人工的に拡大するためにデータオーグメンテーション技術を用いた。
モデルの注目領域を解釈し、分類における特徴量の妥当性を検証するためにGrad-CAM可視化を適用した。
標準指標（トップ1精度、トップ5精度、平均平均精度（mAP））を用いて性能を評価した。

実験結果

リサーチクエスチョン

RQ1非医療分野のデータセットから得た事前学習済みCNN特徴量は、スクラッチからのCNN学習と比較して、ヒストパスロジー画像分類において競争力のある性能を達成できるか？
RQ2微調整により、事前学習済みネットワークの分類精度がKimia Path24データセットで向上するか？その場合、どのアーキテクチャで向上が見られるか？
RQ3この設定において、なぜ微調整によりInception-v3の性能が向上するが、VGG16では向上しないのか？
RQ4スクラッチからの学習で得た特徴量と比較して、事前学習済みネットワークからの深層特徴量は、表現力に優れているか？
RQ5限られたアノテート済みヒストパスロジー画像データの課題に対して、転移学習はどの程度効果的に緩和できるか？

主な発見

特にInception-v3を用いた微調整により、74.87％のトップ1精度を達成し、スクラッチからの学習を著しく上回った。
微調整なしで事前学習特徴量を用いた場合（FE-Inception-v3）でも、70.94％のトップ1精度を達成し、非医療分野データからの強力な一般化能力を示した。
VGG16では微調整が性能向上に寄与しなかった（トップ1精度63.85％）、これはそのアーキテクチャがこのデータセットでは適応に寄与しない可能性を示唆している。
Inception-v3の微調整により、特徴抽出のみの状態と比較してトップ1精度が3.93％絶対的に向上した。これは、Inception-v3がヒストパスロジーのパターンに適応可能であることを示している。
Grad-CAMの可視化結果から、モデルが生物学的に関連する構造（例：組織の縁やテクスチャパターン）に注目していることが確認され、モデルの解釈可能性が裏付けられた。
本研究では、アノテート済みデータが限られるデジタル病理会診分野において、事前学習済みネットワークを用いた転移学習が、極めて効果的かつ効率的な戦略であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。