[論文レビュー] Classification of Histopathological Biopsy Images Using Ensemble of Deep Learning Networks
この論文は、転移学習を用いた事前学習済みCNNの三経路アンサンブル(VGG19、MobileNet、DenseNet201)を提案し、二値分類で乳腺病理画像を分類し、4つの公開データセットで最先端の結果を達成する。
Breast cancer is one of the leading causes of death across the world in women. Early diagnosis of this type of cancer is critical for treatment and patient care. Computer-aided detection (CAD) systems using convolutional neural networks (CNN) could assist in the classification of abnormalities. In this study, we proposed an ensemble deep learning-based approach for automatic binary classification of breast histology images. The proposed ensemble model adapts three pre-trained CNNs, namely VGG19, MobileNet, and DenseNet. The ensemble model is used for the feature representation and extraction steps. The extracted features are then fed into a multi-layer perceptron classifier to carry out the classification task. Various pre-processing and CNN tuning techniques such as stain-normalization, data augmentation, hyperparameter tuning, and fine-tuning are used to train the model. The proposed method is validated on four publicly available benchmark datasets, i.e., ICIAR, BreakHis, PatchCamelyon, and Bioimaging. The proposed multi-model ensemble method obtains better predictions than single classifiers and machine learning algorithms with accuracies of 98.13%, 95.00%, 94.64% and 83.10% for BreakHis, ICIAR, PatchCamelyon and Bioimaging datasets, respectively.
研究の動機と目的
- 複数ソースから収集された組織病理画像データの異種性という課題に対処する。
- handcrafted features を用いず、良性 vs 悪性の乳腺組織病理画像の堅牢な二値分類器を開発する。
- 転移学習とデータ拡張を活用して、データセット間の一般化を改善する。
- 公開ベンチマーク上で、単一CNNおよび従来の機械学習手法と比較してアンサンブルモデルを評価する。
提案手法
- 特徴抽出のためにVGG19、MobileNetV2、DenseNet201を組み合わせた三経路アンサンブルアーキテクチャ。
- ImageNetで重み付けされたCNNからの転移学習を行い、2クラス出力へファインチューニングする。
- 最終層を平坦化して結合し、マルチビュー特徴ベクトルを多層パーセプトロン分類器へ入力する。
- 前処理には染色標準化(Macenko)、画像正規化、データ拡張(反転、回転、ズーム等)を含む。
- 訓練の詳細:画像は224x224にリサイズ、バッチサイズ32、エポック1000、Adam最適化、ドロップアウト0.5、256隠れニューロンのFC層。
実験結果
リサーチクエスチョン
- RQ1三経路CNNアンサンブルは、単一CNNおよび従来の機械学習手法より、複数データセットにわたる二値乳腺病理分類を改善できるか。
- RQ2染色標準化と拡張を伴う転移学習は、異種データセット(BreakHis、ICIAR、PatchCamelyon、Bioimaging)への一般化にどう影響するか。
- RQ3アンサンブルと個別アーキテクチャを公開ベンチマーク上で比較したときの正確度や他の指標はどうなるか。
主な発見
| データセット | 精度 | 適合率 | 再現率 | F値 |
|---|---|---|---|---|
| BreakHis | 98.13% | 98.75% | 98.54% | 98.64% |
| PatchCamelyon* | 94.64% | 95.70% | 95.27% | 95.50% |
| ICIAR | 95.00% | 95.91% | 94.00% | 94.94% |
| Bioimaging | 83.10% | 92.60% | 71.42% | 80.64% |
- BreakHisでは、アンサンブルは99%付近の正確度を達成。
- PatchCamelyon*では、アンサンブルは約95%前後の正確度を達成。
- ICIARでは、アンサンブルは約95%の正確度を達成。
- Bioimagingでは、アンサンブルは約83%の正確度を達成。
- 単一CNN(VGG19、MobileNetV2、DenseNet201)および他の最先端CNNは、BreakHis、ICIAR、PatchCamelyon*データセットで一般的にアンサンブルを下回る傾向があり、Bioimagingは全体的に性能が低く難しい。
- 複数の機械学習モデル(Decision Tree、Random Forest、XGBoost、AdaBoost、Bagging)と比較して、アンサンブルは大半のデータセットで優れた性能を示したが、特定データセットでは一部の文献手法がより高い正確度を達成している例もある(例:BreakHisにおけるPratiher & Chattoraj 2019)。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。